2016年10月14日 星期五

R語言中的資料結構

把一堆資料存在一個變數中,根據不同的存放方式,資料結構可以分成下面幾種:

  • 向量(Vector):
    一堆資料排成一串每筆資料的資料型態都必須一樣
    一般會用到的就是浮點數向量、字串向量......
     
  • 矩陣(Matrix):
    向量的二維版本,資料型態必須要一樣
     
  • 陣列(Array):
    向量的多維版本,資料型態必須要一樣
     
  • 因子(Factor):
    跟向量一樣是一堆資料排成一串,但每筆資料會是分類變數(categorical variable),另加入分類名稱彙整資訊
     
  • 串列(List):
    跟向量一樣是一堆資料排成一串,但可以是不同資料型態的變數混搭在一起。而且每筆資料可以是向量、矩陣、陣列、甚至是串列。簡單說就像一串列車,每節車廂要塞什麼東西都可以,是最具彈性的資料存放方式。許多統計分析函數回傳值都會是串列
     
  • 資料框架(Data frame):
    類似Excel的資料表,每個欄位存放的資料型態必須要一樣、但不同欄位就可以不一樣。一般來說資料從外部存入都會存成資料框架
     
  • 時間序列(Time series):
    可以是向量、矩陣、或是陣列,多加入時間的資訊在這個資料結構裡面

簡單的使用範例可參考《Vector, Array, List and Data Frame in R》
變數的基本資料型態參考《R語言的基本資料型態》

_EOF_

沒有留言:

張貼留言