728x90
반응형
판다스
-
파이썬 데이터 전처리 총정리생활정보 2023. 11. 17. 09:40
안녕하세요 오늘은 파이썬 데이터 분석에서 데이터 전처리 방법을 정리해 보겠습니다. 싸이킷런과 판다스 패키지를 사용합니다. 1. 결측치 최빈값으로 채워넣기# 결측치 최빈값으로 채워 넣기 m = df['colname'].mode()[0] df['colname'] = df['colname'].fillna(m) 2. 특정 컬럼 결측치 있는행 삭제df=df.dropna(subset = ['colname1', 'colname2']) 3. 특정 컬럼 삭제df = df.drop(['colname1'], axis=1) 4. 중복값 제거df = df.drop_duplicates() 5. 스케일링 아래 코드는 최소최대 스케일링입니다. 다른 스케일링은 MinMaxScaler() 대신 해당하는 메소드를 입력하세요from skl..