본문 바로가기
데이터분석과 AI/빅데이터 분석기사

[빅데이터분석기사 실기] 시험 시 주의사항, 꿀팁 방출

by 우공80 2023. 6. 23.
728x90

빅데이터 분석기사 시험 볼 때 주의 사항

한 달 정도 빅데이터분석기사 실기를 준비한 것 같습니다.
실기 준비를 해보니, 문제가 어렵지는 않은데, 실수를 하는 부분이 있습니다.

시험 중에 실수할 수 있는 부분을 정리하고, 시험 전에 한번 숙지하면 좋을 것 같습니다.

  • 메모장 사용
    print() 문을 사용해서 출력한 데이터프레임, info(), describe() 등 시험 환경의 작업창에서 보기 힘들고,
    모델의 성능 지표도 관리가 필요하므로 메모장을 활용하자. (시험 중 사용 가능)

  • dir과 help 잘 사용하기
    라이브러리나 함수명이 기억이 안나면 dir과 help를 사용해서 조회해보자

  • 문제의 요구사항을 놓치지 말자
    소수점 자리수, 제외해야 하는 값 등을 고려하지 않고 틀리는 경우가 많으니 조심하자.

  • 검산을 하자
    오류가 나면 차라리 다행이다. 작업형1은 오류가 발생하지 않고, 잘못된 계산 결과가 나오기 쉬우니, 
    다양한 방법으로 검산을 하자.

  • 부동소수점 오류 조심
    python은 부동소수점 방식으로 실수를 표현하므로 계산 순서에 따라 다른 결과가 나올 수 있다.
    문제에서 요구하는 순서대로 계산을 하자. 수학적으로 같다고 같은 결과가 나오리란 법이 없다. 
    ex) a * a / 10 / 10 ≠ (a / 10) * (a / 10) 일 수 있다.

  • sort후 loc 사용 조심
    sort_values 후에는 index가 뒤섞인다. loc를 사용하면 원하는 결과가 나오지 않는 경우가 생긴다.
    reset_index를 하거나, iloc를 사용해야 한다.

  • 작업형2 의 제출 파일 형식 확인
    제출해야 되는 결과가 확률값인지 label(정수)값인지 확인해야 한다.
    보통 index를 제외하고 제출하라고 되어있으므로 index가 제외되었는지 확인하자.
    제출해야 하는 컬럼명을 정확히 확인하자.

  • 데이터프레임의 행이나 열이 많을 때
    특히 열이 많을 때는 ...으로 가려진 열을 고려하지 않는 경우가 종종있다.

  • 작업형2의 제출 파일은 눈으로 확인
    값이 제대로 들어가있는지 눈으로 확인하자

  • 작업형2에서 잘 안되면 수치형 변수만 가지고 예측하자

  • inplace=True 옵션은 데이터프레임에 반영되지 않는 경우가 종종 생기니 사용에 주의하자.
    (특히 replace)

  • 작업형1에서도 결측치가 존재할 수 있다. 확인하자.

  • label encoding 할 때, train과 test 의 범주가 다르면 unseen 오류가 발생할 수 있다. 
    train, test를 합쳐서 label encoding 후 분리하거나, 별도 로직을 써야 함.

  • 제출해야 하는 test 데이터에 dropna()를 하면 건수 맞지 않아서 오류가 발생한다.

  • 전처리는 train 데이터를 기준으로 test 데이터를 처리해야 한다.
  • 시험 환경에서 1분의 실행시간 제한이 있으므로 안전하게 50초 내 실행되도록 코드를 짜자.

  • 작업형3에서 귀무가설과 대립가설을 어떻게 설정할 지 신경써서 보자.
    귀무가설은 통계의 기본가정(정규성, 등분산성)을 충족하거나, 집단에 차이가 없는 것으로 설정한다.

  • 작업형2에서 중간중간 shape, describe 등을 이용해서 검산을 하자.


※ 위 내용은 "빅데이터 분석기사 실기 준비를 위한 캐글 놀이터"를 따라가며 공부한 내용입니다.

https://www.kaggle.com/datasets/agileteam/bigdatacertificationkr

 

Big Data Certification KR

빅데이터 분석기사 실기 (Python, R tutorial code)

www.kaggle.com

 

위의 팁에 따라 열공한 결과...

 

2023.07.07 - [데이터분석과 AI/빅데이터 분석기사] - [빅데이터분석기사 실기] 제6회 실기 시험 만점(100점) 합격 후기

 

[빅데이터분석기사 실기] 제6회 실기 시험 만점(100점) 합격 후기

올해 상반기 내내 준비한 제6회 빅데이터 분석기사 실기시험 결과가 오늘 발표되었습니다. 예상하긴 했지만, 100점이네요.^^ 좋은 결과 얻었던 비결?? 까지는 아니지만, 개인적으로 어떻게 준비했

woogong80.tistory.com

 

728x90

댓글