본문 바로가기
728x90

우공이산250

실전 시계열 분석-Practical Time Series Analysis 리뷰 데이터 분석을 처음 시작하게 되면 회귀, 분류 알고리즘을 배우고 적용해 보게 됩니다. 그리고 업무에 적용해 보려고 애쓰다 보면, 매출, 고객 VOC, 오류율 등 다양한 비즈니스 데이터가 시계열 특성을 가지고 있음을 알게 됩니다. 시계열 데이터는 초보 분석가가 배웠던 선형 회귀 알고리즘으로 분석이 어려운 부분이 존재합니다. 블로그나, 유튜브, 인터넷 강의로 공부를 하면서, 이론적으로 보강을 하기 위해 이 책을 읽게 되었습니다. 이 책은 제목 그대로 시계열 분석에 한정해서 서술하고 있습니다. 시계열에 대한 기본적인 이론과 대표적인 통계 알고리즘인 ARIMA부터, 상태공간 모델로서, 칼만 필터, 은닉 마르코프 모형, 베이즈 구조적 시계열을 다루고, 머신러닝과 딥러닝에서 시계열을 활용하는 방법을 다룹니다. 그리.. 2023. 8. 23.
pd.describe() 사용법 파이썬에서 데이터를 로딩하고 가장 많이 사용하는 함수 중의 하나가 describe 함수입니다. 사용법은 간단한데, descirbe 함수가 범주형에 대해서도 통계정보를 생성해 준다는 것을 모르는 분들이 종종 있어서 정리해 놓습니다. 1. 예시 데이터 생성 import pandas as pd data = {'Age': [25, 30, 22, 40, 28], 'Height': [170, 160, 175, 162, 180], 'Weight': [65, 70, 60, 75, 85], 'Gender': ['Male', 'Female', 'Male', 'Female', 'Male']} df = pd.DataFrame(data) 2. 수치형 데이터에 대한 통계 생성 print("Numeric Data Summary:".. 2023. 8. 16.
소변검사로 알수 있는 질병 소변 검사는 개인의 건강에 대한 귀중한 정보를 제공하는 일반적인 진단 도구입니다. 소변 검사는 다양한 질병과 상태를 식별하는 데 도움을 줄 수 있습니다. 소변 검사를 통해 확인하거나 모니터링할 수 있는 대표적인 질병은 다음과 같습니다. 요로 감염(UTI): UTI는 요로의 세균 감염으로 인해 발생합니다. 소변의 백혈구, 아질산염 및 박테리아 수치가 높아지면 UTI가 있음을 나타낼 수 있습니다. 당뇨병: 소변 검사는 포도당 수치를 모니터링하는 데 도움이 될 수 있습니다. 당뇨병으로 알려진 소변 내 포도당의 존재는 조절되지 않는 당뇨병을 나타낼 수 있습니다. 신장 질환: 만성 신장 질환 및 신장 감염과 같은 상태는 소변 검사를 통해 감지할 수 있습니다. 소변 내 단백질(단백뇨) 또는 적혈구(혈뇨)의 비정상적.. 2023. 8. 15.
이혼으로 가는 네 가지 독 - 신디의 결혼수업 중 결혼 생활을 망치는 네 가지 독이 있습니다. "신디의 결혼수업"에서 읽고 알게 되었고, 다양한 매체에서 소개가 되기도 했습니다. 책 리뷰에서 별도 분리하여 포스팅을 하는 것이 좋겠다는 생각이 들었네요. 이 네 가지 독이란 "비난", "경멸", "방어", "담쌓기"를 말합니다. 이 네 가지 말을 높은 빈도로 사용하는 부부의 90% 이상이 결국 파경을 맞이한다고 합니다. 첫 번째 독은 비난입니다. 우선 비난은 불평과는 다릅니다. 불평에는 구체적인 정황이 있지만 비난은 상대를 부정하고 공격하는 것이 목적입니다. "나 진짜 힘들어. 새벽에 아기 보느라 잠도 거의 못 잤어. 오빠가 좀 도와주면 안 돼?" 이건 불평입니다. 하지만, 아래 말은 비난입니다. "나 진짜 힘들어. 오빠는 왜 이렇게 배려가 없어? 맨날 회.. 2023. 8. 15.
부동소수점 이란? 부동소수점 계산 방식에 따른 오차 발생 예제 빅데이터분석기사 준비 중에 논리적으로는 맞지만, 실제로는 답이 틀리는 경우를 경험한 적이 있습니다. 부동소수점 계산방식으로 인한 오류였는데요. IEEE 754 부동소수점 표기법이란? IEEE 754 부동소수점 표기법은 실수에 대한 산술 연산을 이진 형식으로 표현하고 수행하기 위해 널리 사용되는 표준입니다. 부동 소수점 숫자가 구조화되고 메모리에 저장되고 조작되는 방식을 정의합니다. 이 표기 방식은 컴퓨터가 일관되고 표준화된 접근 방식으로 매우 큰 값과 매우 작은 값을 포함하여 광범위한 숫자를 처리할 수 있도록 하기 때문에 컴퓨팅에서 특히 중요합니다. IEEE 754에서 부동 소수점 숫자는 다음과 같이 표현됩니다. 부호 비트(s): 이 비트는 숫자의 부호를 나타냅니다. 0은 양수를 나타내고 1은 음수를 나.. 2023. 8. 8.
소변과 건강의 관계 소변 검사는 디양한 병의 원인을 알아내기 위해 자주 사용됩니다. 병원에 가서 소변검사를 통해 병을 진단하는 것이 중요하지만, 소변량이나 색상을 통해 이상을 캐치해야 병원에 갈 생각이 들겠죠? 오늘은 소변량과 소변의 색상과 건강의 관계에 대해 알아보겠습니다. 1. 소변량과 건강의 관계 소변량의 변화는 여러 가지 건강 이슈의 징후일 수 있습니다. 일반적으로 의심해 볼 수 있는 몇 가지 질환에는 다음과 같은 것들이 있을 수 있습니다: 1. 당뇨병: 자주 소변을 자주 볼 수 있으며, 다량의 소변을 배설할 수 있습니다. 2. 신부전: 적은 소변량이나 밤에 빈번한 소변 배출이 있을 수 있습니다. 3. 신염: 소변이 탁하거나 냄새가 강할 수 있으며, 소변량이 적을 수도 있습니다. 4. 전립선 문제: 남성의 경우, 방.. 2023. 8. 6.
시계열 데이터의 특징 5가지 시계열 데이터는 관측치가 특정 시간 간격으로 기록되는 데이터를 의미합니다. 이런 시계열 데이터에는 다른 유형의 데이터와 구별되는 몇 가지 특정 특성이 있습니다. 시간 종속성(Time Dependence): 시계열 데이터는 시간을 기준으로 정렬되며 데이터 포인트의 순서가 중요합니다. 각 관찰은 이전 관찰과 미래 관찰에 따라 달라집니다. 계절성(Seasonality): 많은 시계열이 계절성으로 알려진 반복 패턴 또는 주기를 나타냅니다. 이러한 패턴은 매일, 매주, 매월 또는 매년과 같이 고정된 간격으로 발생할 수 있습니다. 추세(Trend): 추세는 시간 경과에 따른 데이터의 장기적인 움직임을 나타냅니다. 증가, 감소 또는 정지(일정)할 수 있습니다. 노이즈(Noise): 노이즈는 특정 패턴이나 원인에 기인.. 2023. 8. 4.
회귀분석과 시계열분석의 차이 수치를 예측하는 두 가지 분석 방법이 있습니다. 보통 처음 머신러닝을 배우게 되면 회귀를 통해 수치를 예측하는 것을 배웁니다. 그러다 이제 시계열 분석을 알게 되는데요. 회귀와 시계열 분석은 어떤 차이가 있고, 어떨 때 사용하는 것이 좋은지 정리해 보겠습니다. 1. 데이터 유형 회귀 회귀 분석에서 데이터는 하나 이상의 독립 변수(예측 변수)와 종속 변수(예측하려는 결과)로 구성됩니다. 시간의 흐름이 반영되어 있지 않으며, 이를 횡단면데이터라고 부릅니다. 시계열 분석 시계열 분석에서는 일정한 간격으로 시간에 따라 데이터를 수집합니다. 데이터는 시간 종속적이며 각 관찰은 이전 관찰의 영향을 받습니다. 이를 시계열 데이터라고 부릅니다. ※ 다수의 시점에 다수의 독립변수를 가지고 있는 경우 시계열 횡단면 데이터.. 2023. 8. 2.
마그네슘의 효능과 부작용 약 상자를 정리하다가 "마그네슘"을 발견했습니다. 아내가 선물로 받는 것이었는데, 안먹고 계속 그대로 두길래, 저라도 먹으려고 합니다. 그래서 마그네슘 효능이 무엇인지, 혹시 부작용은 없는지 알아보겠습니다. 1. 마그네슘의 효능 1) 근육 기능 강화: 마그네슘은 근육 수축과 이완에 중요한 역할을 합니다. 근육 기능을 강화하여 운동 성능과 근육 회복을 도울 수 있습니다. 2) 신경 기능 지원: 마그네슘은 신경 전달물질의 활동을 조절하고 신경 기능을 지원합니다. 이로 인해 스트레스 관리와 수면 개선에 도움이 될 수 있습니다. 3) 골격 건강 촉진: 마그네슘은 뼈의 형성과 유지에 필요한 무기질입니다. 골다공증 예방과 뼈 건강을 지원합니다. 4) 심혈관 건강 증진: 마그네슘은 심장 건강을 촉진하고 혈압 조절에 .. 2023. 8. 2.
728x90