-
Pandas 객체 소개 - Index데이터 분석/Pandas 2020. 6. 7. 14:25
Pandas Index 객체 Index 객체는 그 자체로 흥미로운 구조체이며 불변의 배열이나 정렬된 집합 (중복 허용) 으로 볼 수 있다. Index: 불변의 배열 Index 객체는 여러 면에서 배열처럼 동작한다. Index 객체는 NumPy배열에서 익숙한 속성이 많이 있다. 단, Index 객체는 일반적인 방법으로는 변경될 수 없는 불변의 값이다! Immutable 이 불변성 덕분에 예기치 않은 인덱스 변경으로 인한 부작용 없이 여러 DataFrame 과 배열 사이에서 인덱스를 더 안전하게 공유할 수 있다. Index: 정렬된 집합 Pandas 객체는 집합 연산의 여러 측면에 의존하는 데이터 세트 간의 조인과 같은 연산을 할 수 있게 하려고 고안되었다. 그래서 합집합, 교집합, 차집합을 비롯해 그 밖의..
-
Pandas 객체 소개 - DataFrame데이터 분석/Pandas 2020. 6. 7. 14:16
Series: 유연한 인덱스를 가지는 1차원 배열 DataFrame: 유연한 행 인덱스와 유연한 열 이름 (인덱스)을 가진 2차원 배열 Pandas DataFrame 객체 DataFrame 은 정렬된 Series 객체의 연속으로 볼 수 있다. 즉, 같은 인덱스를 공유하는 Series 객체의 조합이다. - 행 인덱스: 도시이름 공유 - 열 인덱스: (도시 단위) 인구수, (도시 단위) 면적 실제로 행과 열 모두 인덱스 객체이다. DataFrame: 특수한 딕셔너리 이렇게 행이름을 기준으로 Series 를 반환한다. DataFrame 객체 구성하기 단일 Series 객체에서 구성하기 DataFrame 은 Series 객체의 집합체로서 열 하나짜리 DataFrame 은 단일 Series 로부터 구성할 수 있다..
-
Pandas 객체 소개 - Series데이터 분석/Pandas 2020. 6. 7. 13:36
Pandas 튜토리얼 및 다큐멘테이션을 펴놓고 시작! http://pandas.pydata.org/ pandas - Python Data Analysis Library pandas pandas is a fast, powerful, flexible and easy to use open source data analysis and manipulation tool, built on top of the Python programming language. Install pandas now! pandas.pydata.org Pandas 의 세 가지 기본 자료구조인 Series, DataFrame, Index 에 대해 알아보자. Pandas Series 객체 Pandas Series 는 인덱싱된 데이터의 1차원 배열..
-
Pandas 소개 - Pandas 를 왜 사용해야할까?데이터 분석/Pandas 2020. 6. 7. 10:50
NumPy 의 ndarray 데이터 구조는 산술 연산 작업에서 전형적으로 볼 수 있는 깨끗하고 잘 정리된 데이터 타입을 위한 핵심적인 기능을 제공한다. 문제는 현실은 안깨끗하다는 점이다....ㅎㅎ - 유연성이 더 필요하고 (데이터에 레이블을 붙이거나 누락된 데이터로 작업하는 등) - 요소 단위의 브로드캐스팅에 잘 매핑되지 않는 연산 (그룹화, 피벗 등) 을 하고자 하는 경우에 한계가 있는 것은 분명하다. 각 경우는 주변 세계에서 다양한 형태로 존재하는 덜 구조화된 데이터를 분석하는 데 중요한 부분이다. 그래서 Pandas Library 가 등장했다. Pandas 는 NuMpy 를 기반으로 만들어진 새로운 패키지로서 DataFrame 이라는 효율적인 자료구조를 제공한다. Pandas 에서도 특히 Serie..