본문 바로가기
728x90

데이터분석과 AI/데이터분석과 AI 문법(Python)16

비지도학습의 앙상블 방법(iris) 회사에서 시스템 개선을 위한 문제 발굴 차원에서 텍스트 데이터를 수집해서 분석을 하고 있습니다. 수십만 개 고객의견을 눈으로 보고 손으로 분류하기는 힘들어서 군집 분석을 한 후에 토픽 모델링으로 맥락을 찾으려고 했는데요. 대략적인 전처리를 한 후에 몇 가지 군집분석 알고리즘으로 분류를 해보았지만, 제대로 군집이 만들어지지는 않았습니다. 문득, 우리가 지도학습에서 앙상블 하는 것처럼 비지도학습에서도 앙상블을 할 수 있지 않을까 싶어서 ChatGPT의 도움을 받아 비지도학습 앙상블 하는 방법을 찾아서 공유합니다. 원래는 텍스트를 분류하는 것이었지만, 여기서는 간단하게 iris 데이터로 진행합니다.from sklearn.datasets import load_iris from sklearn.cluster imp.. 2023. 5. 12.
Python에서 DataFrame의 목록을 출력하는 방법 데이터프레임을 계속 만들다 보면 한번 정리하고 싶을 때가 있습니다. 이럴 때 데이터프레임 목록을 출력하는 방법입니다. 두 개 함수를 사용합니다. dir() : 객체의 리스트를 출력합니다. 이때 출력되는 리스트는 객체 자체가 아니라 객체의 이름, 즉, 문자열입니다. eval() : 문자열을 코드로 인식하게 하는 함수입니다. 아래 코드에서는 dir()로 객체의 이름을 불러오고 for문을 돌면서 해당 이름을 사용하는 객체가 DataFrame이면 DataFrame의 이름과 타입을 출력하는 코드 입니다. for object in dir(): if type(eval(object))==pd.core.frame.DataFrame: print(object, type(eval(object))) 2022. 9. 13.
Python 함수 tooltip 보는 방법 별 거 아니지만, 오래 손 놓았다가 다시 만질 때 한 번 씩 헷갈려서 적어놓습니다 Google Colaboratory Google Colaboratory의 경우 특별히 키를 누르지 않아도 자동으로 함수 tooltip이 보입니다. Jupyter Notebook shift + tab 을 누르면 함수 tooltip이 나타납니다. - 끝 - 2022. 9. 6.
Jupyter Notebook, Jupyterlab 자동완성(TAB) 안될 때 tab 키.. python Jupyterlab에서는 변수나 함수의 앞글자를 입력하고 tab키를 누르면 자동 완성해주는 기능이 있습니다. 그런데, 얼마 전부터 사내 데이터분석 플랫폼의 Jupyterlab에서 tab 눌렀을 때, 자동완성이 안 먹히기 시작했습니다. 뭐 잠깐 기능이 로딩이 안되었나 싶었는데, 며칠째 똑같은 증상이라 너무 불편했습니다. shift + tab 으로 함수 명세 보는 부분은 또 잘 나오네요. 해결방법 - jedi 패키지 문제 구글에서 검색해보니 jedi라는 패키지 때문에 발생하는 문제라서, 패키지를 삭제하거나 아래와 같은 명령어를 실행하라고 합니다. %config Completer.use_jedi = False 위 코드를 실행하고 나니 tab 눌렀을 때 자동완성 기능이 잘 먹습니다. .. 2022. 8. 23.
[Excel]입력한 값이 잘못되었습니다. 이셀에 입력할 수 있는 값은 제한되어있습니다 현상: 입력한 값이 잘못되었습니다. 이셀에 입력할 수 있는 값은 제한되어있습니다. 오류가 나올 때 해결:[데이터]-[유효성 검사] 안에서 설정값 변경. [모두지우기] 가 편함. 2022. 8. 6.
구글맵에서 주소로 GPS 좌표(위도, 경도) 찾는 쉬운 방법 데이터 분석을 하다 보면 특정 위치의 좌표를 구해야 할 때가 있습니다. 예) 지도 그려놓고 중심점을 잡는다던지 할 때 기존에는 구글 맵에서 주소를 검색하고, 정보 탭을 보면 좌표가 나왔었는데, 방식이 변경되었습니다. 찾기가 좀 어렵기 때문에, 헤매지 마시라고 포스팅 작성합니다. 저도 한참 여기저기 눌러보며 찾은 방법입니다. pc버전과 모바일앱 버전이 사용 방법이 약간 달라서 구분하여 정리하였습니다. PC 버전 좌표를 확인하고자 하는 지점에 마우스 우클릭을 하면 아래 그림과 같이 팝업 메뉴가 뜹니다. 여기서 “이곳이 궁금한가요?”를 클릭합니다. 그러면 아래 그림과 같이 지도에 마커가 남는데, 이 마커를 클릭합니다. 그러면 아래 그림처럼 해당 지점과 검색창에 위경도 좌표가 표시됩니다. 모바일 앱(Map or.. 2022. 7. 6.
python에서 DataFrame의 목록을 출력하기 dir() : 객체의 리스트를 출력합니다. 이때 출력되는 리스트는 객체 자체가 아니라 객체의 이름, 즉, 문자열입니다. eval() : 문자열을 코드로 인식하게 하는 함수입니다. 아래 코드에서는 dir()로 객체의 이름을 불러오고 for문을 돌면서 해당 이름을 사용하는 객체가 DataFrame이면 DataFrame의 이름과 타입을 출력하는 코드 입니다. for object in dir(): if type(eval(object))==pd.core.frame.DataFrame: print(object, type(eval(object))) 2020. 10. 22.
728x90