ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • 평가 - 5
    Python Machine Learning/평가 2020. 7. 30. 18:49

    분류에 사용되는 성능 평가 지표로는 정확도, 오차 행렬, 정밀도, 재현율, F1 스코어, ROC-AUC가 있으며 

    특히 이진 분류의 레이블 값이 불균형하게 분포될 경우에는 정확도만으로는 머신러닝 모델의 예측 성능을

    평가할 수 없습니다.

     

    오차 행렬은 Negative와 Positive값을 가지는 실제 클래스 값과 예측 클래 값이 True와 False에 따라 

    TN, FP, FN, TP로 매핑되는 4분면 행렬을 기반으로 예측 성능을 평가합니다.

     

    정밀도와 재현율은 Positive 데이터 세트의 예측 성능에 초점을 맞춘 평가지표로 분류하려는 업무의 특성상 특별히 강조돼야 할 경우 분류의 결정 임계값을 조정해 정밀도, 재현율의 수치를 높이는 방법이 있습니다.

     

    F1스코어는 정밀도와 재현율을 결합한 평가 지표로서, 정밀도와 재현율이 어느 한쪽으로 치우치지 않을 때 높은 지표값을 가지게 됩니다.

     

    ROC-AUC는 일반적으로 이진 분류의 성능 평가를 위해 가장 많이 사용되는 지표로, AUC값은 ROC 곡선 밑의 면적을 구한 것으로서 일반적으로 1에 가까울수록 좋은 수치입니다.

     

    지금까지 분류에 사용되는 성능 평가 지표에 대해서 설명하였으니 다음부터는 머신러닝 기반의 분류를 설명하겠습니다.

    'Python Machine Learning > 평가' 카테고리의 다른 글

    평가 - 4  (0) 2020.07.30
    평가 - 3  (0) 2020.07.30
    평가 - 2  (0) 2020.07.29
    평가 - 1  (0) 2020.07.29
Designed by Tistory.