[ML] Tabular - 표 형식 데이터 2
·
AI/ML&DL
들어가며1편에서는 Tabular 데이터가 무엇인지, 어떤 특징이 있는지, 그리고 어떤 종류의 문제에 쓰이는지를 살펴봤다. 2편에서는 실제로 머신러닝 모델을 만들기 위해 거치는 전체 파이프라인을 단계별로 이해한다. 머신러닝 파이프라인이란? 머신러닝 프로젝트는 단순히 "모델을 학습시키는" 것이 전부가 아니다. 원시 데이터가 실제 예측 서비스로 변환되기까지는 여러 단계를 거쳐야 한다. 이 흐름을 ML 파이프라인(Machine Learning Pipeline) 이라고 한다. 데이터 수집 (Data Collection) ↓탐색적 데이터 분석 (EDA) ↓전처리 (Preprocessing) ↓모델링 (Modeling) ↓평가 (Evaluation) ↓배포 및 ..