데이터 가공 및 변환 : 모든 데이터를 숫자로 변경하는 것이 중요
- 데이터 가공 정의 : Raw 데이터를 적절하게 변환
- 데이터 전처리 정의 : Raw 데이터를 적절하게 처리
-> 둘의 차이가 무엇인가? 헷갈림
Feature Enginerring 용어를 사용함. 데이터 전처리
1차적으로 데이터 가공을 함. : 쓰지 않을 컬럼 삭제/행 추출(예: 조건문 부여, 이상치 제거)/파생 변수
Feature Engineering : 인코딩 변환(문자 컬럼을 숫자로 변경)
Feature Scaling : 숫자 컬럼을 적절하게 표준화, 정규화)
주성분 분석(PCA)(숫자 컬럼을 적절하게 줄여주는 역할, 차원축소)
요인분석(Factor Analysis)(숫자 및 문자 컬럼을 적절하게 줄여주는 역할)
'Python' 카테고리의 다른 글
[머신러닝] 분류모델 평가지표 (0) | 2024.02.20 |
---|---|
하이퍼 파라미터 - Grid Search, Random Search (0) | 2024.02.19 |
PyCaret Windows 10 아나콘다 설치 (0) | 2024.02.14 |
환경 변수 설정으로 API 키 숨기기 (0) | 2024.02.01 |
[Streamlit] Input widgets(예시/연습) (1) | 2024.01.29 |