본문 바로가기

Coding/Python

(2)
Pandas 뉴비를 위한 메서드 정리 2 1편에서 말한 것처럼 Pandas는 표 형태의 다양한 데이터를 가져오는 기능 자체만으로 상당히 강력합니다. 그러나 제가 생각하기에는 진정한 강점은 데이터를 분류하고 조건을 걸어 볼 수 있는 필터링을 제공하는 점이 아닐까 싶습니다! 오늘은 데이터를 가져오는 새로운 방법과 데이터를 필터링하는 다양한 메서드를 살펴보겠습니다. 새로운 방법으로 데이터 가져오기 이번에는 데이터를 다룰 때 항상 샘플로 사용하는 두 데이터를 불러보려 합니다. 바로 타이타닉 데이터와 Iris 꽃잎 데이터입니다. 그런데, 파이썬에서 모든 데이터를 항상 실제 파일 경로를 통해 가져올 수 있는 것은 아닙니다. 바로 시각화 패키지 Seaborn을 통해 샘플 데이터를 가져올 수 있습니다. 아래는 깃허브에서 해당 패키지의 메서드에서 불러올 수 있..
Pandas 뉴비를 위한 메서드 정리 1 대학 수료 후 따로 수강 중인 데이터 분석 커리큘럼을 복기하면서 주제파악의 시간이 있었다. 그래서 자주 활용할 수 있는 메서드를 손에 익히고 뉴비에게 도움이 될 수 있도록 정리를 하고자 한다! 물론 나도 뉴비이기 때문에 실력이 화려하거나 세련되지는 않다. 흔한 Pandas 찍먹 포스팅이라고 생각해주면 감사합니다. 우선 판다스는 무엇일까? Pandas는 데이터 조작 및 처리, 분석에 용이한 파이썬 라이브러리이다. 물론 데이터를 다뤄주는 액셀도 프로그래밍을 하지 않는 입장에서는 무척 편하다. 하지만 데이터의 양이 늘어남에 따라 액셀로는 한계가 있는 경우가 종종 생긴다. 따라서 판다스는 액셀이 다룰 수 있는 것 이상의 용량에서 쓰기 좋다. 데이터 읽어오기 데이터를 분석하려면 당연하지만 먼저 데이터를 읽어와야한..