2017年7月7日 星期五

指令列處理文本的工具

在Linux與Mac都提供終端機,並且有一系列的指令用來處理文件:
  1. find, grep
  2. sed, awk
  3. tr, cut, paste
  4. cat, more, less, head, tail, 
  5. fmt, pr
  6. wc, bc
  7. sort, uniq
熟悉上述的指令,運用正規表達式(regular expression)並搭配資料重新導向(I/O redirection),其實許多資料處理根本不需要寫程式,直接用指令就可以處理完成
上面指令大概的意思是:
  1. 找文件檔案位置、找文件特定內容
  2. 編輯修改文件、根據特定欄位挖資料
  3. 取代特定內容、根據欄位切、接內容
  4. 印出文件 ;看頭看尾
  5. 格式化印出文件
  6. 計算行數字數、計算機
  7. 排序、合併重複的字串
_EOF_

沒有留言:

張貼留言