컴공

분류성능지표/혼동행렬

확률기반의사결정 2025. 4. 21. 05:40

예측(Predicted)기준으로 뒤에 Positive,Negative가 정해짐

맞으면 앞에 True 틀리면 False

Accuracy는 예측한 결과들 중에서 맞춘거 / 전체

클래스 불균형 문제가 있을때 다수를 기준으로 그냥 예측때려버려도 Accuracy가 높게 나오는 문제점이 있음

예를 들어 A가 90개 B가 10개인경우에 모델이 전부 다 A로 예측해도 Accuracy는 0.9

Precision은 모델이 참이라고 예측한것들 중에서 참의 비율

오탐지를 줄이는 경우에 사용할 수 있음 (스팸예측)

 

Recall은 전체 True인 데이터들 중에서 몇개를 맞췄는지의 비율

FN(미탐지)를 줄이는 경우에 유용하게 쓸 수 있음 (질병예측)

FN의 비용이 큰 경우에 사용하면 좋음

F1 Score은 Precision과 Recall의 조화평균으로 두개 동시에 고려하려고 할때 사용함 1에 가까울수록 분류성능이 좋은것