2019年8月30日 星期五

Shell一行文:FASTA核酸序列轉成大寫

要把FASTSA序列檔案通通轉成大寫,最直接的方式用tr指令:
  • cat DEMO.fasta | tr '[:lower:]' '[:upper:]'
但這樣會把開頭是>的註解行也通通轉成大寫,要避免此狀況用下面指令:
  • cat DEMO.fasta | sed '/^[^>]/ y/atcg/ATCG/'
上述sed的單引號內有兩個部分:
  1. /^[^>]/:第一個^代表否定、中括號內的第二個^代表行首。整句的意思就是開頭不是>的那一行才會執行後面的動作
  2. y/atcg/ATCG/:將a, t, c, g分別用A, T, C, G取代


參考資料

_EOF_

沒有留言:

張貼留言