python 데이터 전처리
-
[Python / re] 문자열 패턴 파악 후 데이터 프레임화 & 정규표현식 re이용한 문자열 치환하기python 데이터 전처리 2024. 4. 17. 15:17
re package 설명 : 간단하게 말하자면, 패턴이 있는 문자열을 다루는 패키지이다. 정규표현식 re.sub() python 정규표현식 활용에 사용하는 re 모듈의 함수이다. 문자열에서 패턴에 맞는 부분을 다른 문자열로 대체하는 데 사용된다. re.sub(pattern, replace, text) 이는 text 중에서 해당하는 부분을 replace 로 대체한다. 사용 예시 # 이메일 주소 형식을 간단한 형식으로 변경 email_text = "Contact me at example@mail.com for more information." modified_email = re.sub(r'\w+@\w+\.\w+', 'email', email_text) print(modified_email) # 결과 >>> ..