Python Machine Learning/Pandas

판다스 ( Pandas ) - 3

Data Analytics 2020. 7. 17. 16:28

DataFrame과 리스트, 딕셔너리, 넘파이 ndarray 상호 변환

- read_csv( )를 이용해 생성한 DataFrame은 기본적으로 파이썬의 리스트, 딕셔너리, 그리고 넘파이 ndarray등

  다양한 데이터로부터 생성될 수 있다. 또한 DataFrame 역시 반대로 파이썬의 리스트, 딕셔너리 그리고

  넘파이 ndarray 등으로 변환될 수 있다.

 

1. 넘파이 ndarray, 리스트, 딕셔너리를 DataFrame으로 변환하기

    - 1차원 형태의 리스트와 넘파이 ndarray -> DataFrame ( DataFrame은 2차원 데이터이기 때문에 2차원 이하의 데이터들만 DataFrame으로 변환이 가능)

 

 

 

 

--> 리스트를 이용해 DataFrame 생성

 

--> ndarray를 이용해 DataFrame 생성

 

 

 

 

 

 

 

 

 

 

   - 2차원 형태의 데이터를 기반으로 DataFrame을 생성 ( 2 x 3 형태의 리스트와 ndarray 기반이기에 칼럼이 3개 필요 )

--> 칼럼명이 3개 필요.

 

-->2x3 형태의 리스트와 ndarray 생성 

 

--> 리스트를 이용해 DataFrame 생성

--> ndarray를 이용해 DataFrame 생성

 

 

 

 

 

 

 

 

 

   - 딕셔너리를 DataFrame으로 변환 

      ( 딕셔너리를 변환 시에는 딕셔너리의 키는 칼럼명, 딕셔너리 값은 키( value )에 해당하는 칼럼 데이터로 변환. )

--> Key는 컬럼명으로 매핑, Value는 리스트 형(또는 ndarray)

 

 

 

 

 

1. DataFrame을  넘파이 ndarray, 리스트, 딕셔너리으로 변환하기

- 많은 머신러닝 패키지가 기본 데이터 형으로 넘파이 ndarray를 사용. 따라서 데이터 핸들링 시 DataFrame을 넘파이 ndarray로 변환하는 경우가 빈번. 

- DataFrame을 넘파이 ndarray로 변환하는 것은 DataFrame 객체의 values를 이용.

 

- DataFrame을 ndarray로 변환

--> DateFrame 객체의 values를 이용해 변환.

 

 

 

- DataFrame을 리스트와 딕셔너리로 변환

--> DataFrame을 리스트로 변환할 때는 values로 얻은 ndarray에 tolist( )를 호출

 

 

--> DataFrame을  딕셔너리로의 변환은 DataFrame의 to_dict( ) 메서드를 호출

--> 인자로 'list'를 입력하면 딕셔너리를 리스트형으로 반환.