2016年3月25日 星期五

半淨相關(Semipartial correlation)

Semipartial correlation中文翻譯半淨相關,此分析是用來了解某個因子如何被另外兩個因子所影響。套用前面身高、體重與年齡的例子,淨相關處理的問題是

“當排除掉年齡大小的因素以後,身高與體重的相關性是多少?” 
“當排除掉身高大小的因素以後,年齡與體重的相關性是多少?”

那麼半淨相關(Semipartial correlation)所想要解答的問題會是

當同時考慮身高與年齡時,(排除掉年齡後)身高獨自對體重的影響有多少?”
當同時考慮身高與年齡時(排除掉身高後年齡獨自對體重的影響有多少?”
當同時考慮身高與年齡時身高年齡共同對體重的影響有多少?”

      在此若影響身高獨自的影響叫做a、年齡獨自的影響叫做b、身高與年齡共同的影響叫做ca就是身高其半淨相關值的平方,b就是年齡其半淨相關值的平方。另外要注意一點,c有可能算出來的值會是負的!這是由於suppression in regression models造成的,在這種情況下這些因子之間的關係就無法用文氏圖(Venn diagram)來正確表明三者之間的關係。

      做半淨相關的分析,就可以比較當同時考慮身高與年齡的時候,其分別與共同影響體重的大小差別,這種分析叫做variance partitioning。將前面的ab、 c三者相加,考慮下列三種狀況:
  • a / (c) * 100%  代表的是,身高獨自影響體重的百分比
  • b / (c) * 100%  代表的是,年齡獨自影響體重的百分比
  • c / (c) * 100%  代表的是,身高與年齡共同影響體重的百分比
如此一來,就可以將個因子的影響力量化。


另外有幾點稍微提一下
  • 淨相關、半淨相關背後都與multiple regression有關
  • 淨相關會比半淨相關要大
  • Semipartial correlation也叫做part correlation,注意不要與partial correlation搞混
  • 三個因子畫出來的Venn diagram也叫做"ballantine"

_EOF_

沒有留言:

張貼留言