728x90
한 달 정도 빅데이터분석기사 실기를 준비한 것 같습니다.
실기 준비를 해보니, 문제가 어렵지는 않은데, 실수를 하는 부분이 있습니다.
시험 중에 실수할 수 있는 부분을 정리하고, 시험 전에 한번 숙지하면 좋을 것 같습니다.
- 메모장 사용
print() 문을 사용해서 출력한 데이터프레임, info(), describe() 등 시험 환경의 작업창에서 보기 힘들고,
모델의 성능 지표도 관리가 필요하므로 메모장을 활용하자. (시험 중 사용 가능) - dir과 help 잘 사용하기
라이브러리나 함수명이 기억이 안나면 dir과 help를 사용해서 조회해보자 - 문제의 요구사항을 놓치지 말자
소수점 자리수, 제외해야 하는 값 등을 고려하지 않고 틀리는 경우가 많으니 조심하자. - 검산을 하자
오류가 나면 차라리 다행이다. 작업형1은 오류가 발생하지 않고, 잘못된 계산 결과가 나오기 쉬우니,
다양한 방법으로 검산을 하자. - 부동소수점 오류 조심
python은 부동소수점 방식으로 실수를 표현하므로 계산 순서에 따라 다른 결과가 나올 수 있다.
문제에서 요구하는 순서대로 계산을 하자. 수학적으로 같다고 같은 결과가 나오리란 법이 없다.
ex) a * a / 10 / 10 ≠ (a / 10) * (a / 10) 일 수 있다. - sort후 loc 사용 조심
sort_values 후에는 index가 뒤섞인다. loc를 사용하면 원하는 결과가 나오지 않는 경우가 생긴다.
reset_index를 하거나, iloc를 사용해야 한다. - 작업형2 의 제출 파일 형식 확인
제출해야 되는 결과가 확률값인지 label(정수)값인지 확인해야 한다.
보통 index를 제외하고 제출하라고 되어있으므로 index가 제외되었는지 확인하자.
제출해야 하는 컬럼명을 정확히 확인하자. - 데이터프레임의 행이나 열이 많을 때
특히 열이 많을 때는 ...으로 가려진 열을 고려하지 않는 경우가 종종있다. - 작업형2의 제출 파일은 눈으로 확인
값이 제대로 들어가있는지 눈으로 확인하자 - 작업형2에서 잘 안되면 수치형 변수만 가지고 예측하자
- inplace=True 옵션은 데이터프레임에 반영되지 않는 경우가 종종 생기니 사용에 주의하자.
(특히 replace) - 작업형1에서도 결측치가 존재할 수 있다. 확인하자.
- label encoding 할 때, train과 test 의 범주가 다르면 unseen 오류가 발생할 수 있다.
train, test를 합쳐서 label encoding 후 분리하거나, 별도 로직을 써야 함. - 제출해야 하는 test 데이터에 dropna()를 하면 건수 맞지 않아서 오류가 발생한다.
- 전처리는 train 데이터를 기준으로 test 데이터를 처리해야 한다.
- 시험 환경에서 1분의 실행시간 제한이 있으므로 안전하게 50초 내 실행되도록 코드를 짜자.
- 작업형3에서 귀무가설과 대립가설을 어떻게 설정할 지 신경써서 보자.
귀무가설은 통계의 기본가정(정규성, 등분산성)을 충족하거나, 집단에 차이가 없는 것으로 설정한다. - 작업형2에서 중간중간 shape, describe 등을 이용해서 검산을 하자.
※ 위 내용은 "빅데이터 분석기사 실기 준비를 위한 캐글 놀이터"를 따라가며 공부한 내용입니다.
https://www.kaggle.com/datasets/agileteam/bigdatacertificationkr
위의 팁에 따라 열공한 결과...
2023.07.07 - [데이터분석과 AI/빅데이터 분석기사] - [빅데이터분석기사 실기] 제6회 실기 시험 만점(100점) 합격 후기
728x90
'데이터분석과 AI > 빅데이터 분석기사' 카테고리의 다른 글
[빅데이터분석기사 실기][작업형3] 등분산 검정(levene, bartlett, fligner) (0) | 2023.06.25 |
---|---|
[빅데이터분석기사 실기][작업형3] 비모수 검정 wilcoxon 부호순위 테스트 (단일표본, 대응표본) (0) | 2023.06.24 |
[빅데이터분석기사 실기][작업형3]카이제곱 검정(적합도 검정, 독립성 검정)+피셔의 정확검정 (0) | 2023.06.22 |
[빅데이터분석기사 실기][작업형1] 모듈, 함수 이름과 사용법이 생각나지 않을 때, dir, help, __all__ (0) | 2023.06.18 |
[빅데이터분석기사 실기][작업형1] 슬라이싱 (0) | 2023.06.17 |
댓글