슬.공.생

BoostCourse(DL)(week3)-Confusion Matrix 본문

study/DeepLearning

BoostCourse(DL)(week3)-Confusion Matrix

AGT (goh9510@naver.com) 2022. 8. 9. 21:35

본 포스팅은 부스트 코스의 [ 파이토치로 시작하는 딥러닝 기초 ]와 [ Pytorch로 시작하는 딥러닝 입문 ]의 내용을 통해 학습한 내용입니다.

 

파이토치로 시작하는 딥러닝 기초

부스트코스 무료 강의

www.boostcourse.org

 

 

PyTorch로 시작하는 딥 러닝 입문

이 책은 딥 러닝 프레임워크 PyTorch를 사용하여 딥 러닝에 입문하는 것을 목표로 합니다. 이 책은 2019년에 작성된 책으로 비영리적 목적으로 작성되어 출판 ...

wikidocs.net


머신러닝에서는 정확도를 체크해가며 모델을 구현하는데, 이떄 사용되는 것이 혼동행렬(confusion matrix)이다.

 

양성(Positive)과 음성(Negative)을 구분하는 이진 분류를 예시로 들면

혼동 행렬은 다음과 같다. 각 열을 예측값을, 행은 실제값을 나타낸다.

--------------- 참(예측) 거짓(예측)
참(실제) T(rue)P(ositive) F(alse)N(egative)
거짓(실제) F(alse)P(ositive) T(rue)N(egative)

 

예측값이 정확한 경우 True, 아닌경우는 False이며 예측대상에 따라 양성(Positive) 음성(Negative) 로 구분된다.

 


 

위의 Confusion Matrix를 통해 두가지 파라미터를 도출해 내게 된다.

  • 정밀도(Precision)
  • 재현률(Recall)

Precision은 예측과정으로 하나의 선택지를 골랐을때 해당 선택이 얼마나 정확했는지를 나타내는 척도로써 아래와 같이 계산된다.

Positive라고 선택된 전체 경우중, 실제 일치했던 경우의 비율로 나타내진다.

Recall 은 전체 실제값을 예측값이 얼마나 잘 예측(재현)했는지 나타내는 척도로써 아래처럼 계산된다.

Positive가 실제인 경우는 Positive를 맞춘경우와 Negative를 틀린 경우의 합이며, 이에 대한 Positive와 일치한 경우의 수에대한 비율이다.

 

Comments