2016年8月12日 星期五

R的ggplot2基本概念

要將資料畫到螢幕上,首先要有資料;再來是指定資料要怎樣繪圖;最後才是調整圖片。

R的ggplot2這個繪圖套件根據下列幾個概念,將資料描繪到圖上:
  • 資料來源(Data):指定資料來源
  • 美學對應(Aesthetics):選定要繪圖的資料點。例如說xy散佈圖,就要指定哪些資料點是x軸、哪些點是要放y軸
  • 幾何圖案(Geometries):要畫成哪種圖,像是直方圖、散佈圖、箱型圖、柱狀圖、折線圖等等。更多種繪圖方式可以參考ggplot2的Geoms列表
  • 數值範圍(Scales):根據數值範圍可以上不同的顏色,例如說數值由小而大從藍到紅描繪在圖上。參考ggplot2的Scales列表
  • 繪圖面(Facets):將很多張圖放在一起比較,參考ggplot2的Faceting列表
  • 統計轉換(Statistics):將指定的資料轉換成各種統計量,像將連續轉成離散
  • 座標系統(Coordinates):一般是直角座標系統,也可以對調座標,或用極座標系統、甚至是地圖的座標系統。參考ggplot2的Coordinate systems
  • 繪圖主題(Theme):資料以外的繪圖物件,像是說明文字的調整等等

簡單的圖只要前面三個Data + Aesthetics + Geometries就可以畫出來了。更多內容參考GTW寫的《R ggplot2教學:基本概念與qplot函數》裡面ggplot繪圖架構那張圖,Science Craft上的文章《Introducing the Grammar of Graphics Plotting Concept》與Thomas Hopper寫的《A simple Introduction to the Graphing Philosophy of ggplot2》

R的ggplot2這個套件提供兩個繪圖的指令:

如果要練習需要資料的話,ggplot2這個套件也提供了10組資料,列表如下:
  • diamonds:53,940顆原鑽的價格與特性
  • economics:隨時間變化的美國經濟指標
  • faithfuld:2d density estimate of Old Faithful data
  • luv_colours:CIE 1976 (L*, u*, v*) 表色系,簡稱CIELUV。用L, u, v三個數值來描述一種顏色,另外還有附上顏色的名稱,總共列出了657種顏色
  • midwest:中西部人口動態。參考《Midwest Demographic Analysis》
  • mpg:從1999到2008,38種流行汽車的油耗資料
  • msleep:83種哺乳動物的誰面資料
  • presidential:從艾森豪到歐巴馬等11位美國總統的任期、所屬政黨
  • seals:Vector field of seal movements
  • txhousing:德州售屋資訊

_EOF_

沒有留言:

張貼留言