Python

Feature Enginering

jsys 2024. 2. 19. 17:45

데이터 가공 및 변환 : 모든 데이터를 숫자로 변경하는 것이 중요

- 데이터 가공 정의 : Raw 데이터를 적절하게 변환
- 데이터 전처리 정의 : Raw 데이터를 적절하게 처리

-> 둘의 차이가 무엇인가? 헷갈림
  Feature Enginerring 용어를 사용함. 데이터 전처리 

1차적으로 데이터 가공을 함. : 쓰지 않을 컬럼 삭제/행 추출(예: 조건문 부여, 이상치 제거)/파생 변수

Feature Engineering : 인코딩 변환(문자 컬럼을 숫자로 변경)

Feature Scaling : 숫자 컬럼을 적절하게 표준화, 정규화)
주성분 분석(PCA)(숫자 컬럼을 적절하게 줄여주는 역할, 차원축소)
요인분석(Factor Analysis)(숫자 및 문자 컬럼을 적절하게 줄여주는 역할)