2018年12月24日 星期一

R語言使用split分割資料表

對於一個資料表d(這邊是InsectSpray的資料),首先用下面指令看結構: 
  • d <- InsectSpray
  • class(d)
  • str(d)
知道某欄位(這邊以spray)有A, B, C, ...幾種,可以根據此欄位的值篩選出所有的列:
  • dA <- subset(d, d$spray=="A")
  • dABC <- subset(d, d$spray %in% c("A", "B", "C"))

但是,像上面spray欄位有A, B, C, D, E, F六個值,若每次都要手動另外生成新的變數來存取篩選出來的資料表會很麻煩,R語言裡面有split指令可以自動幫忙分群,在上述的利字就是將df資料根據spray這個欄位分群:
  • s <- split(d, d$spray)
  • class(s)
  • str(s)

分群的結果會塞到s這個變數裡面。這個變數將會是個列表list,列表裡面的每個元素則是依據分群產生的資料表~

參考資料

_EOF_

沒有留言:

張貼留言