판다스 ( Pandas ) - 3
DataFrame과 리스트, 딕셔너리, 넘파이 ndarray 상호 변환
- read_csv( )를 이용해 생성한 DataFrame은 기본적으로 파이썬의 리스트, 딕셔너리, 그리고 넘파이 ndarray등
다양한 데이터로부터 생성될 수 있다. 또한 DataFrame 역시 반대로 파이썬의 리스트, 딕셔너리 그리고
넘파이 ndarray 등으로 변환될 수 있다.
1. 넘파이 ndarray, 리스트, 딕셔너리를 DataFrame으로 변환하기
- 1차원 형태의 리스트와 넘파이 ndarray -> DataFrame ( DataFrame은 2차원 데이터이기 때문에 2차원 이하의 데이터들만 DataFrame으로 변환이 가능)
--> 리스트를 이용해 DataFrame 생성
--> ndarray를 이용해 DataFrame 생성
- 2차원 형태의 데이터를 기반으로 DataFrame을 생성 ( 2 x 3 형태의 리스트와 ndarray 기반이기에 칼럼이 3개 필요 )
--> 칼럼명이 3개 필요.
-->2x3 형태의 리스트와 ndarray 생성
--> 리스트를 이용해 DataFrame 생성
--> ndarray를 이용해 DataFrame 생성
- 딕셔너리를 DataFrame으로 변환
( 딕셔너리를 변환 시에는 딕셔너리의 키는 칼럼명, 딕셔너리 값은 키( value )에 해당하는 칼럼 데이터로 변환. )
--> Key는 컬럼명으로 매핑, Value는 리스트 형(또는 ndarray)
1. DataFrame을 넘파이 ndarray, 리스트, 딕셔너리으로 변환하기
- 많은 머신러닝 패키지가 기본 데이터 형으로 넘파이 ndarray를 사용. 따라서 데이터 핸들링 시 DataFrame을 넘파이 ndarray로 변환하는 경우가 빈번.
- DataFrame을 넘파이 ndarray로 변환하는 것은 DataFrame 객체의 values를 이용.
- DataFrame을 ndarray로 변환
--> DateFrame 객체의 values를 이용해 변환.
- DataFrame을 리스트와 딕셔너리로 변환
--> DataFrame을 리스트로 변환할 때는 values로 얻은 ndarray에 tolist( )를 호출
--> DataFrame을 딕셔너리로의 변환은 DataFrame의 to_dict( ) 메서드를 호출
--> 인자로 'list'를 입력하면 딕셔너리를 리스트형으로 반환.