-
평가 - 1Python Machine Learning/평가 2020. 7. 29. 16:40
머신러닝은 데이터 가공/변환, 모델 학습/예측, 그리고 평가의 프로세스로 구성됩니다.
타이타닉 생존자 예제에서는 모델 예측 성능의 평가를 위해 정확도를 이용했습니다.
머신러닝 모델은 여러 가지 방법으로 예측 성능을 평가할 수 있으며 성능 평가 지표는 일반적으로 모델이 분류냐 회귀냐에 따라 여러 종류로 나뉩니다.
분류는 실제 경과 데이터와 예측 결과 데이터가 얼마나 정확하고 오류가 적게 발생하는가에 기반하지만, 상황에 맞는 성능 평가 지표를 사용하여 잘못된 평가 결과에 빠지지 않도록 합니다.
분류의 성능 평가 지표로는 다음과 같습니다.
- 정확도( Accuracy )
- 오차행렬( Confusion Matrix )
- 정밀도( Precision )
- 재현율( Recall )
- F1스코어
- ROC AUC
회귀는 실제값과 예측값의 오차 평균값에 기반합니다. 기본적으로 예측 오차를 가지고 정규화 수준을 재가공하는 방법이 회귀의 성능 평가 지표 유형으로 회귀를 위한 평가는 추후 회귀에 따라 정리하여 설명하고
이번 장에서는 분류에 사용되는 성능 평가 지표에 대해서 설명하겠습니다.