본문 바로가기
데이터분석과 AI/파이썬을 엑셀처럼 쓰기

5. 데이터의 기본 개요 확인 방법 (info, describe)

by 우공80 2022. 9. 16.
728x90

데이터프레임은 엑셀에 없는 몇가지 편의 기능을 제공하는데요. 

데이터에 대한 요약이나, 데이터의 기술통계(평균,합계 등 기본 통계라고 생각하시면 됩니다.)를 확인할 수 있는 함수가 있습니다.

 

pandas.DataFrame.info

 

info() 함수는 데이터프레임의 크기, 컬럼의 타입등을 보여줍니다.

전체 행/열 수를 확인하고, 각 컬럼과 비교하면 결측치(값이 없는 데이터)를 확인할 수 있고,

데이터 타입에 따라 어떻게 데이터를 수정할지 검토할 수 있습니다.

boston_price.info()

 

 

boston_price 데이터는 총 506개의 행과 14개의 컬럼을 가지고 있고, 결측치는 존재하지 않는 다는 것을 알수 있습니다.

그리고 모든 열이 수치형 데이터인 것을 알수 있습니다.

pandas.DataFrame.describe

describe()함수는 데어터의 기술통계(합계,개수,평균 등 기본 통계로 이해하시면 됩니다.)를 한번에 확인할 수 있는 함수입니다.

boston_price.describe()

위 그림과 같이 count (갯수), mean(평균), std(표준편차), min/max(최소값/최대값), 25%,50%,75% 각 분위값이 계산되어 나오는 것을 보실수 있습니다. 참고로 수치형 컬럼에 대해서만 표시되며, object(문자열 등)인 경우에는 표시하지 않습니다.(당연한 거긴 합니다)

728x90

댓글