본문 바로가기

전체 글122

[비트캠프 - 클라우드 기반 AlaaS 개발자 과정] 22.11.17.(DAY-24) TIL 1. 이론 1) 코드 내 이론 pickile = 정형데이터 불러오는 과정에서 속도 빠르게 하는 거.? crime.to_pickle("save/police_pos.pickle") #피클파일로 저장 print(pd.read_pickle("save/police_pos.pickle")) #피클파일 불러서 프린트 NaN index 지우기 def save_cctv_pos(self): cctv = self.cctv pop = self.pop cctv.rename(columns={cctv.columns[0]:"구별"}, inplace=True) pop.rename(columns={ pop.columns[0] : "구별", pop.columns[1]: "인구수", pop.columns[2]: "한국인", pop.colu.. 2022. 11. 18.
[비트캠프 - 클라우드 기반 AlaaS 개발자 과정] 22.11.16.(DAY-23) TIL 1. 이론 1) 코드 내 이론 구글맵스플랫폼 사용하기 # pip install googlemaps 해주기 import googlemaps gmaps = googlemaps.Client(key=발급코드) # 클라이어언트로 구글맵스에 접속해 지도를 가져옴 g = gmaps.geocode("서울종로경찰서", language='ko')) # 지도자료가 리스트형식으로 a에 할당 2) 용어 ** 프로그램을 만드는 거 = 프로젝트 ** ** 코드 짤 때 데이터구조 분류가 중요 ⇒ 타겟(Y) | 입력(X) / interval | ratio | norminal | ordinal 타겟변수의 값 = class 예측값(E) = predicate 정확도 = accurate 분류 = classification 신경망 모델 = N.. 2022. 11. 17.
[비트캠프 - 클라우드 기반 AlaaS 개발자 과정] 22.11.15.(DAY-22) TIL 1. 이론 1) 코드 내 이론 a) 구간변수 필터링(범주형은 필터링 할게 없었음) def interval_variables(self): df = self.df # 결측값 필터링 cols1 = ['AGEP', 'BDSP', 'CONP', 'ELEP', 'GASP', 'HINCP', 'NRC', 'RMSP', 'VALP'] # 구간변수 처리 시작 print(df[cols1].describe()) print(df[cols1].skew()) print(df[cols1].kurtosis()) print (df['CONP'].value_counts(normalize=True)) df.drop('CONP', axis=1, inplace=True) # 결측값 99.6% => 50% 이상-> 필터링 print(df.sh.. 2022. 11. 16.
[비트캠프 - 클라우드 기반 AlaaS 개발자 과정] 22.11.14.(DAY-21) TIL 1. 이론 1) 코드 내 이론 프로젝트의 흐름 문제제기 → 데이터구하기 → 타깃 변수 설정 → 데이터 처리 → 탐색적 자료 분석 및 시각화 → 머신러닝 모델 수립 → 머신러닝 모델 실행 →최적모델서넉 및 활용 뇌졸중 예측 분석 ⇒ 데이터 처리까지 1. 문제 제기 뇌졸중이 어떻게 발병하는 지 알아보기 위해 영양을 미치는 요인에 대해 분석하기 2. 데이터 구하기 케글사이트 Stroke Prediction Dataset 3. 타깃 변수(= 종속변수) 설정 타깃변수명 : stroke 타깃변숫값 : 과거에 한 번이라도 뇌졸중이 발병했으면 1, 아니면 0 4. 데이터처리 a. 데이터 불러오기 import pandas as pd import numpy as np class StrokeService: def __ini.. 2022. 11. 15.