본문 바로가기
728x90

빅데이터분석기사40

[빅데이터분석기사 필기] Part02. 빅데이터 탐색-Ch01. 데이터 전처리 ※ 모든 내용을 정리한 것은 아니며, 중요도가 낮거나, 공부하지 않아도 맞출 수 있는 부분은 정리하지 않았습니다. 01. 데이터 정제 - 중요도 하(★) 1. 데이터에 내재된 변수의 이해 - 데이터 관련 정의: 데이터, 단위(Unit), 관측값, 변수, 원자료(Raw Data) (1) 단위(Unit): 관찰되는 항목 또는 대상 - 데이터의 종류 (1) 단변량 자료: 자료의 특성을 대표하는 특성 변수가 하나 (2) 다변량 자료: 자료의 특성을 대표하는 특성 변수가 둘 이상 (3) 질적 자료: 정성적 또는 범주형 자료, 명목자료, 서열자료 등 이질적 자료로 분류 . 명목자료: 측정대상이 범주나 종류에 대해 구분되는 것을 수치 또는 기호로 분류되는 자료(ex. 전화번호 국번) . 서열자료: 명목자료와 비슷하나.. 2023. 4. 1.
[빅데이터분석기사 필기] Part01. 빅데이터 분석 기획-Ch03. 데이터 수집 및 저장 계획 ※ 모든 내용을 정리한 것은 아니며, 중요도가 낮거나, 공부하지 않아도 맞출 수 있는 부분은 정리하지 않았습니다. 01. 데이터 수집 및 전환 - 중요도 하(★) 1. 데이터 수집 - 여러 장소에 있는 데이터를 한 곳으로 모으는 것 - 데이터 수집 수행 자료: 용어집, 원천 데이터 소유 기관 정보, 서비스 흐름도, 데이터 명세서, 각종 매뉴얼, 비즈니스 모델 - 비즈니스 도메인과 원천 데이터 정보 수집: 비즈니스 모델, 용어집, 프로세스, 도메인 전문가 인터뷰, 원천 데이터의 수집 가능성, 보안, 정확성, 수집 난이도와 비용 (신속성 X) - 내외부 데이터 수집: 내부 데이터는 실시간 수집, 외부데이터는 일괄 수집, 일정 주기 수집(이걸 이렇게 딱 정할 수 있나..) - 데이터의 특징 : 단순한 객체로도.. 2023. 3. 30.
[빅데이터분석기사 필기] Part01. 빅데이터 분석 기획-Ch02. 데이터 분석 계획 ※ 모든 내용을 정리한 것은 아니며, 중요도가 낮거나, 공부하지 않아도 맞출 수 있는 부분은 정리하지 않았습니다.01 분석 방안 수립 - 중요도 상(★★★)1. 데이터 분석- 데이터 분석: 인사이트를 발굴하고 이를 공유하여 의사결정을 지원하는 것을 목표로 데이터를 정의, 수집 변환, 모델링, 시각화하는 과정이다. - 빅데이터를 활용하기 위한 장애물은 비용보다 데이터 분석을 수행하기 위한 분석적 방법과 성과에 대한 이해의 부족이다. - 데이터 분석 시 고려사항: 데이터 분석은 규모가 아니라 어떤 시각과 통찰을 얻을 수 있는가의 문제이다. 2. 데이터 분석 기획- 어떠한 목표를 달성하기 위해 어떠한 데이터를 가지고 어떤 방식으로 수행할 것인가에 대한 일련의 계획을 수립한다. - 분석기획은 분석 과제 및 프로.. 2023. 3. 29.
[빅데이터분석기사 필기] Part01. 빅데이터 분석 기획-Ch01. 빅데이터의 이해 ※ 모든 내용을 정리한 것은 아니며, 중요도가 낮거나, 공부하지 않아도 맞출 수 있는 부분은 정리하지 않았습니다. 01. 빅데이터 개요 및 활용 - 중요도 하(★) 1. 데이터와 정보 - 데이터의 정의 : 추론과 추정의 근거를 이루는 사실 - 데이터의 특징 : 단순한 객체로도 가치가 있으며, 다른 객체와의 상호관계 속에서 더 큰 가치를 갖는다. - 데이터의 구분 정량적 데이터 정성적 데이터 유형 정형, 반정형 비정형 특징 여러 요소의 결합으로 의미 부여 객체 하나가 함축된 의미 내포 관점 객관적 주관적 구성 수치, 기호 문자, 언어 형태 데이터베이스, 스프레드시트 웹 로그, 텍스트 파일 위치 DBMS, 로컬 시스템 등 내부 웹사이트 모바일 플랫폼 등 외부 분석 쉬움 어려움 - 데이터의 유형 (품질과는 무.. 2023. 3. 26.
728x90