학부 수업/머신러닝
4.5. 머신러닝의 정확도, 정밀도, 재현율 (Accuracy, Precision, Recall)
백지오
2020. 9. 23. 15:48
반응형
머신러닝의 결과 분석에는 다양한 지표를 사용한다. 이때, 주로 흔히 사용되는 지표인 정확도, 정밀도, 재현율을 살펴보자.
암 진단 모델을 예시로 들어보자. 암 진단 결과에는 양성Positive과 음성Negative이 있을 수 있고, 모델은 정답을 맞추거나 실패할 수 있다. 즉, 가능한 결과는 True Positive, True Negative, False Positive, False Negative의 4가지 이다.
먼저, 가장 흔히 사용되는 정확도Accuracy는 말 그대로 전체 샘플 중 맞게 예측한 샘플 수의 비율이다.
$$ \text{accuracy} = \frac{\text{TP}+\text{TN}}{\text{TP}+\text{TN}+\text{FP}+\text{FN}} $$
정밀도Precision는 어떤 클래스에 속한다고 예측한 샘플 중, 실제로 해당 클래스에 속한 샘플 수의 비율이다.
$$ \text{precision} = \frac{\text{TP}}{\text{TP}+\text{FP}}$$
재현율Recall은 실제 특정 클래스에 속한 샘플 중에, 특정 클래스에 속한다고 예측한 표본 수의 비율이다. 즉, 특정 클래스에 대한 정확도이다.
$$ \text{recall} = \frac{\text{TP}}{\text{TP}+\text{FN}} $$
반응형