2019年7月1日 星期一

混淆矩陣之 Sensitivity vs. Specificity

判斷一個預測的準確程度,會先把實際情形與預測結果的數量畫出一個矩陣,這個矩陣稱之為混淆矩陣(Confusion Matrix),畫出來就是下列的形式:

真實情況
有, +無, -



陽性 Positive, P(真陽性, TP)(偽陽性, FP)
陰性 Negative, N(偽陰性, FN)(真陰性, TN)
(y=TP+FN)(n=FP+TN)

上述表格裡面使用(小括號)圈起來的代表是要填寫自然數,裡面縮寫分別代表:
  • TP:True Positive、實際有且檢出為陽性
  • FP:False Positive、 偽陽性Type I error
  • TN:True Negative、實際無且檢出為陰性
  • FN:False Negative偽陰性Type II error
  • y = TP+FN:實際有的個數
  • n = FP+TN:實際無的個數

有了這些資料,我們就可以計算出這個測試的靈敏度與特異度,表格如下:

真實情況
有, +無, -



陽性 Positive, P(Sensitivity)(FPR)
陰性 Negative, N(FNR)(Specificity)

上述的表格裡面(小括號)圍起來的是計算後得到的小數,縮寫分別代表:
  • Sensitivity = TP/y:靈敏度又有下列的其他名稱
    True positive rate, TPR, Recall, Power, Hit-rate
  • FPR = FP/n:False positive rate又可稱之為Fall-out 
  • FNR = FN/y:False negative rate又可稱之為Miss rate 
  • Specificity = TN/n:特異度又有下列其他名稱
    Selectivity, True negative rate, TNR 

對一個檢測來說最好的情況就是Sensitivity與Specificity都很高,但檢測常會遇到需要妥協狀況,這個時候的判斷方式就是看比較討厭哪一種錯誤發生:
  • 希望靈敏度高:對於實際有的狀況,不太能容許偽陰性出現
    簡言之,對於實際有的狀況希望能夠通通都檢出來
  • 希望特異度高:對於實際無的狀況,不太能容許 偽陽性出現
    簡言之,對於實際無的狀況期望能通通都分辨出來

參考資料

_EOF_

1 則留言: