판다스 기초 강의 01. 기본 자료형 시리즈와 데이터프레임. 판다스(Pandas)는 데이터 분석을 위한 필수 라이브러리로 다양한 기능을 제공한다. 판다스를 배우기 위해서는 가장 기본이 되는 자료형 시리즈(Series)와 데이터프레임(DataFrame)을 이해해야 한다.
판다스 기초 강의
시리즈 자료형
판다스 시리즈 자료형은 순차적으로 나열된 1차원 배열의 자료형으로 인덱스(Index)와 데이터(Data)가 대응되는 구조로 파이썬 딕셔너리 자료형과 동일한 구조를 가지고 있다. 보통 딕셔너리 자료를 만들고 그것을 다시 변수에 시리즈로 대입하는 방식으로 만든다. 그럼 시리즈를 만들어보자.
판다스 라이브러리를 불러오고
import pandas as pd
변수 data에 딕셔너리 자료형을 대입
data = { ‘a’ : 1, ‘b’ : 2, ‘c’: 3 }
변수 series에 변수 data를 시리즈 자료형으로 변환하여 대입
series = pd.Series(data)
마지막으로 프린트함수로 변수 series 출력
print(series)
코드를 실행하면 위와 같은 결과가 나타나며 1차원 배열이 되는 시리즈 자료형의 구조를 알 수 있다.
판다스 기초 강의
데이터프레임 자료형
데이터프레임은 시리즈가 모여 2차원 배열을 형성한 자료형이다. 쉽게 말하면 행(row)과 열(column)로 구성된 표로 이해하면 된다. 키에 대응하는 값을 목록으로 만든 딕셔너리 자료형을 그것을 변수에 데이터프레임으로 대입하는 방식으로 만든다. 그러면 키가 컬럼의 인덱스 이름이 되고 값은 시리즈로 나열된다. 직접 만들어보자.
판다스 라이브러리를 불러온다.
import pandas as pd
변수 data에 딕셔너리 자료형을 대입한다.
data = { ‘A’ : [ 1, 2, 3 ],
‘B’ : [ 4, 5, 6 ],
‘C’ : [ 7, 8, 9 ] }
변수 df에 변수 data를 데이터프레임으로 변환하며 대입한다.
df = pd.DataFrame(data)
마지막으로 출력한다.
print(df)
코드를 실행하면 위와 같이 2차원 배열이 되는 데이터프레임 자료형의 구조를 알 수 있다.
추천 포스트
아나콘다 & 주피터 노트북 설치
링크: https://k-man.kr/3226
딕셔너리 자료형 이해하기
링크: https://k-man.kr/2906
답글 남기기