-
파이썬 데이터사이언스 핸드북 2 장 - 구조화된 데이터데이터 분석/NumPy 2020. 5. 31. 14:35
NumPy 에서 복합적인 이종 데이터를 효율적으로 저장하기 위한 구조화된 배열과 레코드 배열에 관해 설명하겠다. 이후 Pandas DataFrame 을 사용할 때에도 도움이 된다. NumPy 배열은 데이터 타입이 1개이다. 하지만 이렇게 하면 이 세 배열이 서로 연관돼 있음을 알 수 없다. 이 데이터를 모두 단일 구조에 저장할 수 있다면 더 자연스러울 것이다. NumPy 는 복합 데이터 타입을 가지는 배열인 구조화된 배열을 통해 이런 경우를 처리할 수 있다. 구조화된 데이터, 구조화된 배열 복합 데이터 타입을 가지는 빈 컨테이너 배열을 만들었다. key-value 쌍으로 이루어진 딕셔너리 방식으로 지정했다. 'U10' 은 최대 길이 10을 갖는 유니코드 문자열이고, 'i4' 는 4바이트 (즉, 32비트)..