Bioinformatics/ML, DL

[평가지표] 이진 분류 평가 지표 (Metrics for Binary Classification)

김개발^^ 2022. 2. 28. 17:48
반응형

< 이진 분류 평가 지표 (Metrics for Binary Classification) >

 

[평가지표] Confusion Matrix (혼동 행렬)

< Confusion Matrix (혼동 행렬) > TP(True Positive) : 실제 Positive(1), 예측 Positive(1) == True TN(True Negative) : 실제 Negative(0) / 예측 Negative(0) == True FP(False Positive) : 실제 Negative(0)..

dev-kimke.tistory.com

↑ 먼저 이걸 알아야 함

 

1. Accuracy (정확도)

  • 전체 예측 중 얼마나 올바른 예측을 했는지를 나타내는 지표.
  • 값이 높을 수록 예측 정확도도 높음.
  • Error Rate = 1 - Accuracy 
  • 데이터가 불균형(imbalanced)할 경우, 데이터에 따라 긍정인 것만 예측을 잘하고 부정인 것은 예측을 잘 못하는 상황이 생길 수 있음.(이 경우엔 F1 Score 사용 추천)
  • 데이터가 균형(balanced)일 때는 괜찮음.

 

2. Recall (aka Sensitivity) (민감도)

  • TPR(True Positive Rate)로 실제 Positive를 얼마나 잘 예측했는지를 나타내는 지표.
  • 민감도가 높을 수록 좋은 척도.
  • 행방향

 

3. Precision (정밀도)

  • Positive로 예측한 것 중 실제로 맞춘 비율.
  • 열방향

 

4. Specificity (특이도)

  • 실제 Negative를 얼마나 잘 예측했는지 나타내는 지표.
  • FPR(False Positive Rate) = 1 = Specificity

 

5. F1 Score (F-measure)

  • 데이터가 불균형(imbalanced)한 분류 문제에서 주로 사용.
  • Recall과 Precision의 Harmonic Mean(조화 평균)

 

 

참고자료

반응형