데이터 일반화 vs 표준화 (Normalization and Standardization of Data)
2020.04.28
머신러닝 용어 중 가장 헷갈리고, 면접 질문 등에도 단골로 등장하는 것들이 바로 Normalization, Standardization 그리고 Regularization이라고 생각한다. 실제로 필자도 모 AI 기업 면접에서 긴장한 나머지 이것들을 헷갈린 적이 있다. ~zation이라는 유사성과 같은 단어라도 표준화, 일반화, 정규화 등 여러가지로 번역된 점이 이 단어들을 헷갈리게 만든다고 생각한다. 오늘은 이 중에서도 데이터와 관련된 일반화Normalization와 표준화Standardization를 다뤄보고자 한다. (Regularization도 매우 중요하니 다음에 다뤄보겠다!) 제목은 한글로 쓰는 내 나름의 블로그 방침 상 번역된 이름을 썼지만, 아래부터는 혼동을 방지하기 위해 영어를 주로 쓰겠다...