반응형
< 이진 분류 평가 지표 (Metrics for Binary Classification) >
↑ 먼저 이걸 알아야 함
1. Accuracy (정확도)
- 전체 예측 중 얼마나 올바른 예측을 했는지를 나타내는 지표.
- 값이 높을 수록 예측 정확도도 높음.
- Error Rate = 1 - Accuracy
- 데이터가 불균형(imbalanced)할 경우, 데이터에 따라 긍정인 것만 예측을 잘하고 부정인 것은 예측을 잘 못하는 상황이 생길 수 있음.(이 경우엔 F1 Score 사용 추천)
- 데이터가 균형(balanced)일 때는 괜찮음.
2. Recall (aka Sensitivity) (민감도)
- TPR(True Positive Rate)로 실제 Positive를 얼마나 잘 예측했는지를 나타내는 지표.
- 민감도가 높을 수록 좋은 척도.
- 행방향
3. Precision (정밀도)
- Positive로 예측한 것 중 실제로 맞춘 비율.
- 열방향
4. Specificity (특이도)
- 실제 Negative를 얼마나 잘 예측했는지 나타내는 지표.
- FPR(False Positive Rate) = 1 = Specificity
5. F1 Score (F-measure)
- 데이터가 불균형(imbalanced)한 분류 문제에서 주로 사용.
- Recall과 Precision의 Harmonic Mean(조화 평균)
참고자료
반응형
'Bioinformatics > ML, DL' 카테고리의 다른 글
머신러닝 워크플로우 (ML workflow) (0) | 2023.04.28 |
---|---|
특성 필터링(feature filtering)과 특성 선택(feature selection) (0) | 2023.04.28 |
[평가지표] Confusion Matrix (혼동 행렬) (0) | 2022.02.28 |