빅데이터분석기사
-
빅데이터분석기사 7회 실기 시험 후기 기출문제 유형소개 강좌 추천IT 2023. 12. 3. 09:13
안녕하세요 어제 빅데이터분석기사 7회 실기시험을 보고 후기를 나누려고 합니다. (모두 파이썬으로 풀었습니다.) 1. 문제 복기 《제1유형》 (1번) 결측치 제거후 가장 빈도높은 변수평균구하기 (2번) 특정변수와 가장 큰 상관관계 변수 평균 구하기 (3번) IQR에서 벗어난 값 개수 찾기 시험환경에 적응이 잘 안되어 헤매게 되어 1번 문제에서 시간을 많이 뺐겼습니다. 하지만 모두 연습했던 유형이라 어려움 없이 풀었습니다. 실수를 안했길 빌어봅니다. 《제2유형》- 회귀모델 구축 매출 예측 ■ 데이터 : 제주도 지점 판매데이터 데이터는 train, test 두 개였고, 타겟 분리해서 로그변환했습니다. 결측치는 없었고요. 결정변수에 수치형, 범주형 데이터 함께 있어서 수치형데이터는 최대-최소 스케일링으로, 범주..
-
다중 분류 문제(빅데이터 분석기사 실기 2유형)IT 2023. 11. 28. 22:38
문제 : 'Segmentation' 분류 예측 1. 데이터 불러오기 import pandas as pd train = pd.read_csv("../input/train.csv") test = pd.read_csv("../input/test.csv") 2. ID 삭제, target과 test_id 분리 train = train.drop('ID', axis=1) target = train.pop('Segmentation') test_id = test.pop('ID') 3. 원-핫 인코딩 c_train = train.select_dtypes(include='object') c_test = test.select_dtypes(include='object') n_train = train.select_dtypes(e..
-
파이썬 데이터 전처리 총정리생활정보 2023. 11. 17. 09:40
안녕하세요 오늘은 파이썬 데이터 분석에서 데이터 전처리 방법을 정리해 보겠습니다. 싸이킷런과 판다스 패키지를 사용합니다. 1. 결측치 최빈값으로 채워넣기# 결측치 최빈값으로 채워 넣기 m = df['colname'].mode()[0] df['colname'] = df['colname'].fillna(m) 2. 특정 컬럼 결측치 있는행 삭제df=df.dropna(subset = ['colname1', 'colname2']) 3. 특정 컬럼 삭제df = df.drop(['colname1'], axis=1) 4. 중복값 제거df = df.drop_duplicates() 5. 스케일링 아래 코드는 최소최대 스케일링입니다. 다른 스케일링은 MinMaxScaler() 대신 해당하는 메소드를 입력하세요from skl..