728x90

데이터프레임은 엑셀에 없는 몇가지 편의 기능을 제공하는데요.
데이터에 대한 요약이나, 데이터의 기술통계(평균,합계 등 기본 통계라고 생각하시면 됩니다.)를 확인할 수 있는 함수가 있습니다.
pandas.DataFrame.info
info() 함수는 데이터프레임의 크기, 컬럼의 타입등을 보여줍니다.
전체 행/열 수를 확인하고, 각 컬럼과 비교하면 결측치(값이 없는 데이터)를 확인할 수 있고,
데이터 타입에 따라 어떻게 데이터를 수정할지 검토할 수 있습니다.
boston_price.info()

boston_price 데이터는 총 506개의 행과 14개의 컬럼을 가지고 있고, 결측치는 존재하지 않는 다는 것을 알수 있습니다.
그리고 모든 열이 수치형 데이터인 것을 알수 있습니다.
pandas.DataFrame.describe
describe()함수는 데어터의 기술통계(합계,개수,평균 등 기본 통계로 이해하시면 됩니다.)를 한번에 확인할 수 있는 함수입니다.
boston_price.describe()

위 그림과 같이 count (갯수), mean(평균), std(표준편차), min/max(최소값/최대값), 25%,50%,75% 각 분위값이 계산되어 나오는 것을 보실수 있습니다. 참고로 수치형 컬럼에 대해서만 표시되며, object(문자열 등)인 경우에는 표시하지 않습니다.(당연한 거긴 합니다)
728x90
'데이터분석과 AI > 파이썬을 엑셀처럼 쓰기' 카테고리의 다른 글
7. 컬럼을 추가하고 삭제하기(drop) (4) | 2022.12.01 |
---|---|
6. DataFrame에 필터 걸기(loc, iloc) (0) | 2022.09.25 |
4. EDA(Explorary Data Analytics) 탐색적 자료 분석이란? (0) | 2022.09.16 |
3. 데이터 파일(xlsx, xls, csv) 읽고 쓰기 (0) | 2022.09.14 |
2. Set_option 다루기 (0) | 2022.09.14 |
댓글