EDA 란?
EDA 방법
EDA의 target 데이터
Uni - Non Graphic : Sample Data의 분포를 확인하는 것이 주 목적
Uni - Graphic : Histogram 혹은 Pie chart, Stem-leaf plot, Boxplot, QQplot 등을 사용, 만약 값들이 너무 다양하다면 Binning, Tabulation 등을 활용. QQPlot 이란, 데이터의 분포와 이론상의 분포가 잘 일치하는가를 확인할 수 있는 방법. >> 시각화를 통해 데이터가 정규화를 따르는지 확인하는 것.
Multi - Non Graphic : Relationship 을 보는 것이 주된 목표.
Categorical data 의 경우

Cross-Statistics (Correlation, Covariance)

Multi - Graphic




Useful Pandas Functions:

종류






