pandas
-
[ python / import 에러 ]UnicodeDecodeError: 'utf-8' codec can't decode byte 0xbd in position 1: invalid start byte 에러 해결카테고리 없음 2024. 4. 24. 20:32
import 중 에러과정도시 데이터 중대용량의 csv 파일을 열려고import pandas as pdfile_path = '/Users/파일 경로/공시지가_1990년.csv'df = pd.read_csv(file_path) 에러메세지UnicodeDecodeError: 'utf-8' codec can't decode byte 0xbd in position 1: invalid start byte해결 방안 1import pandas as pdfile_path = '/Users/파일 경로/공시지가_1990년.csv'df = pd.read_csv(file_path, encoding="cp949") read_csv 뒤에 encod..
-
AttributeError: 'list' object has no attribute 'split' 해결 및 데이터프레임 열 타입 변환(str to list)python 데이터 분석 2024. 4. 17. 10:41
문제 AttributeError: 'list' object has no attribute 'split' 이런 에러는 df 나 데이터의 타입을 확인을 잘 안해서 그런 것이다. 저 같은 경우에는 크롤링 데이터를 타입이라는 열에 저장을 하였는데, 타입 열에 저장을 할 때, str 로 저장하였기 때문에 해당 에러가 발생하였다. 데이터 예시 "[타입 1, 타입 2, 타입 3, ...]" 해결 방안 열 변환 데이터 열의 모든 요소들을 str 에서 list 로 바꿔주면 된다. import ast df['타입'] = df['타입'].apply(lambda x: ast.literal_eval(x)) ast.literal_eval() 함수는 표현식 노드나 파이썬 리터럴 또는 컨테이너 표시를 포함한 문자열을 평가한다. 여기..
-
[python / pandas] 변수별 상관계수 구하기 및 내림차순 정렬python 데이터 분석 2024. 4. 15. 01:55
데이터 불러오기 import pandas as pd from sklearn.model_selection import train_test_split from sklearn.linear_model import LinearRegression, Lasso, Ridge, LassoCV, BayesianRidge import statsmodels.formula.api as sm import matplotlib.pylab as plt from dmba import regressionSummary, exhaustive_search from dmba import backward_elimination, forward_selection, stepwise_selection from dmba import adjusted_r2_..
-
[python / pandas] 데이터 분석 기초 - DataFrame 생성, csv 파일 불러오기python 데이터 분석 2024. 3. 20. 10:38
Pandas 파이썬에서 데이터 처리와 분석을 위한 오프 소스 라이브러리이다. 데이터 구조로 Series, DataFrame (df) 객체를 제공한다. DataFrame 은 간단히 말하자면 엑셀과 같은 행과 열을 가진 표를 말한다. 좀더 구체적으로 말하면, Series 들을 하나의 열로 취급한 집합으로, 데이터를 표의 형태로 처리하는 자료구조이다. DataFrame 생성 방법 List 이용하는 방법 import pandas as pd df = pd.DataFrame([[1, 2, 3], [4, 5, 6], [a, b, c]]) df 1 2 3 4 5 6 7 8 9 결과가 이와 같이 나온다. list 안의 리스트가 각 행을 구성하고, 이러한 방식으로 df, DataFrame 을 구성한다. Dictionary..