4.5. 머신러닝의 정확도, 정밀도, 재현율 (Accuracy, Precision, Recall)
반응형
머신러닝의 결과 분석에는 다양한 지표를 사용한다. 이때, 주로 흔히 사용되는 지표인 정확도, 정밀도, 재현율을 살펴보자.
암 진단 모델을 예시로 들어보자. 암 진단 결과에는 양성Positive과 음성Negative이 있을 수 있고, 모델은 정답을 맞추거나 실패할 수 있다. 즉, 가능한 결과는 True Positive, True Negative, False Positive, False Negative의 4가지 이다.
먼저, 가장 흔히 사용되는 정확도Accuracy는 말 그대로 전체 샘플 중 맞게 예측한 샘플 수의 비율이다.
$$ \text{accuracy} = \frac{\text{TP}+\text{TN}}{\text{TP}+\text{TN}+\text{FP}+\text{FN}} $$
정밀도Precision는 어떤 클래스에 속한다고 예측한 샘플 중, 실제로 해당 클래스에 속한 샘플 수의 비율이다.
$$ \text{precision} = \frac{\text{TP}}{\text{TP}+\text{FP}}$$
재현율Recall은 실제 특정 클래스에 속한 샘플 중에, 특정 클래스에 속한다고 예측한 표본 수의 비율이다. 즉, 특정 클래스에 대한 정확도이다.
$$ \text{recall} = \frac{\text{TP}}{\text{TP}+\text{FN}} $$
반응형
'학부 수업 > 머신러닝' 카테고리의 다른 글
6. 규제, 정규화 (Regularization) (0) | 2020.10.21 |
---|---|
5. 선형 회귀 (Linear Regression) (0) | 2020.10.21 |
4. K-최근접 이웃 알고리즘 (K-Nearest Neighbor) (0) | 2020.09.23 |
3. 데이터 변환, 정제, 통합, 균형 (Data Transformation, Cleaning, Integration and Balancing) (0) | 2020.09.13 |
2. 데이터 실수화 (Data Vectorization) (0) | 2020.09.11 |
댓글
이 글 공유하기
다른 글
-
6. 규제, 정규화 (Regularization)
6. 규제, 정규화 (Regularization)
2020.10.21 -
5. 선형 회귀 (Linear Regression)
5. 선형 회귀 (Linear Regression)
2020.10.21 -
4. K-최근접 이웃 알고리즘 (K-Nearest Neighbor)
4. K-최근접 이웃 알고리즘 (K-Nearest Neighbor)
2020.09.23 -
3. 데이터 변환, 정제, 통합, 균형 (Data Transformation, Cleaning, Integration and Balancing)
3. 데이터 변환, 정제, 통합, 균형 (Data Transformation, Cleaning, Integration and Balancing)
2020.09.13