2018年4月19日 星期四

R語言使用tapply做分組統計

在R裡面,對一個資料表的數據要做分組統計,可以接用tapply(R語言的apply家族其中之一)。以下用InsectSprays資料集作為例子。這個InsectSprays資料集只有兩個欄位:
  • spray:使用的殺蟲劑
  • count:使用完殺蟲劑後蟲子的數目
在此只要用tapply,就可以自動根據殺蟲劑分組,做蟲子數目的統計:
  • 計算平均數:tapply(InsectSprays$count, InsectSprays$spray, mean)
  • 計算中位數:tapply(InsectSprays$count, InsectSprays$spray, median)
  • 蟲子數目的統計量:
    tapply(InsectSprays$count, InsectSprays$spray, summary)
第三個欄位是作用在第一個欄位的函數,第二個欄位則是分組個依據

可以對比一下bloxplot
_EOF_

沒有留言:

張貼留言