python 데이터 분석
-
[python / folium] 아무것도 몰라도 할 수 있는 python 지도 시각화 [반복문을 통한 지도에 마커 찍기] -2python 데이터 분석 2024. 5. 22. 15:51
데이터 설명반복문을 통한 지도 위에 마커 찍기for idx, row in df_subway.iterrows(): folium.Marker( location=[row['위도'], row['경도']], popup=row['역명'], icon=folium.Icon(color='blue', icon='info-sign') ).add_to(m) location 에 각 행의 위도, 경도를 담아서Marker 객체에 넣고, add_to(지도 이름)하면 됨. 지도 만드는 방법 링크https://shartarc.tistory.com/33 [python / folium] 아무것도 몰라서 할 수 있는 python 지도 시각화 [지도 만들기]- 1folium 설치!pip in..
-
[python / folium] 아무것도 몰라서 할 수 있는 python 지도 시각화 [지도 만들기]- 1python 데이터 분석 2024. 5. 22. 15:03
folium 설치!pip install folium 지도 만들기 및 보기import folium# 기본 좌표 설정 (구글맵 등을 통해 위도/경도 확인) # 위도latitude = 37.58497566936131# 경도longitude = 127.05853372776028# Map 코드입력m = folium.Map( location=[latitude, longitude], # 위도, 경도 zoom_start = 16, # 확대 범위 (최대 18까지) weight = 750, # 지도 가로 height=500, # 지도 세로 tiles = 'cartodbposi..
-
AttributeError: 'list' object has no attribute 'split' 해결 및 데이터프레임 열 타입 변환(str to list)python 데이터 분석 2024. 4. 17. 10:41
문제 AttributeError: 'list' object has no attribute 'split' 이런 에러는 df 나 데이터의 타입을 확인을 잘 안해서 그런 것이다. 저 같은 경우에는 크롤링 데이터를 타입이라는 열에 저장을 하였는데, 타입 열에 저장을 할 때, str 로 저장하였기 때문에 해당 에러가 발생하였다. 데이터 예시 "[타입 1, 타입 2, 타입 3, ...]" 해결 방안 열 변환 데이터 열의 모든 요소들을 str 에서 list 로 바꿔주면 된다. import ast df['타입'] = df['타입'].apply(lambda x: ast.literal_eval(x)) ast.literal_eval() 함수는 표현식 노드나 파이썬 리터럴 또는 컨테이너 표시를 포함한 문자열을 평가한다. 여기..
-
[python / pandas] 변수별 상관계수 구하기 및 내림차순 정렬python 데이터 분석 2024. 4. 15. 01:55
데이터 불러오기 import pandas as pd from sklearn.model_selection import train_test_split from sklearn.linear_model import LinearRegression, Lasso, Ridge, LassoCV, BayesianRidge import statsmodels.formula.api as sm import matplotlib.pylab as plt from dmba import regressionSummary, exhaustive_search from dmba import backward_elimination, forward_selection, stepwise_selection from dmba import adjusted_r2_..
-
[sklearn / python / pandas] 선형, 이차, 삼차, 로그 모델 RMSE, R2 비교python 데이터 분석 2024. 4. 8. 15:19
(1) 모델 불러오기import numpy as npimport pandas as pdfrom sklearn.metrics import mean_squared_error, r2_scorefrom sklearn.model_selection import train_test_splitfrom sklearn.linear_model import LinearRegression, Lasso, Ri..
-
[python / pandas] 데이터 분석 기초 - DataFrame 생성, csv 파일 불러오기python 데이터 분석 2024. 3. 20. 10:38
Pandas 파이썬에서 데이터 처리와 분석을 위한 오프 소스 라이브러리이다. 데이터 구조로 Series, DataFrame (df) 객체를 제공한다. DataFrame 은 간단히 말하자면 엑셀과 같은 행과 열을 가진 표를 말한다. 좀더 구체적으로 말하면, Series 들을 하나의 열로 취급한 집합으로, 데이터를 표의 형태로 처리하는 자료구조이다. DataFrame 생성 방법 List 이용하는 방법 import pandas as pd df = pd.DataFrame([[1, 2, 3], [4, 5, 6], [a, b, c]]) df 1 2 3 4 5 6 7 8 9 결과가 이와 같이 나온다. list 안의 리스트가 각 행을 구성하고, 이러한 방식으로 df, DataFrame 을 구성한다. Dictionary..
-
[python / scikitlearn] 다중회귀분석 예제 코드 및 설명python 데이터 분석 2024. 3. 19. 10:16
패키지 불러오기 및 데이터 불러오기 import pandas as pd from sklearn.model_selection import train_test_split from sklearn.linear_model import LinearRegression, Lasso, Ridge, LassoCV, BayesianRidge import statsmodels.formula.api as sm import matplotlib.pylab as plt from dmba import regressionSummary, exhaustive_search from dmba import backward_elimination, forward_selection, stepwise_selection from dmba import a..
-
[python / 회귀] scikit-learn 설치 및 다중회귀분석 방법 예제python 데이터 분석 2024. 3. 18. 14:05
package 들 설치 pip install -U scikit-learn pip install statsmodels pip install dmba scikit-learn 은 python 에서 머신러닝을 다룰 때, 필수적인 라이브러리이다. 이는 여러 모듈이 있는데, 모듈은 간단히 말하자면 코딩에서의 수학 공식? 이라고 생각하면 좋다. scikit-learn 은 오픈 소스여서 누구나 기술에 대해 접근하고, 무료다. (보통 이렇게 오픈 소스로 뿌리는 이유는 해당 오픈소스를 발전시키기 위해서이다.) (기업 입장에서는 1. 보안 비용 절감 / 2. 마케팅 비용 절감. 3. 리스크 비용 절감 을 위함을 위해서이다.) scikit-learn 공식 사이트 링크 scikit-learn: machine learning i..