顯示具有 BioInfo生物資訊 標籤的文章。 顯示所有文章
顯示具有 BioInfo生物資訊 標籤的文章。 顯示所有文章

2022年3月4日 星期五

Ubuntu 20.04手動編譯R-4.1.2與套件安裝

編譯之前先參考《Ubuntu 20.04用apt安裝R-3.6.3完整指令》,安裝系統需要的套件;完成後用下面的指令下載原始碼與設定:

wget https://cran.r-project.org/src/base/R-4/R-4.1.2.tar.gz
md5sum R-4.1.2.tar.gz
tar zxf R-4.1.2.tar.gz && cd R-4.1.2
./configure --prefix=/opt/R/4.1.2-lto \
  --with-x --with-ICU \
  --with-libtiff --with-cairo --with-libpng --with-jpeglib \
  --enable-java \
  --enable-lto \
  --enable-memory-profiling \
  --enable-R-shlib

2022年1月4日 星期二

用curl指令下載GitHub的檔案

放在GitHub上面的檔案,用wget即使開啟了--no-check-certificate--content-disposition,也有可能抓不下來。這是因為GitHub可能把檔案放到不是連結看到的地方,連結所在的檔案存放的是要轉往的位址,這時候下載就要用到curl了:

  • curl -LJO  https://github.com/samtools/samtools/releases/download/1.14/samtools-1.14.tar.bz2

如此就能順利下載samtools-1.14.tar.bz2,參數意義如下:

2021年12月31日 星期五

指令裡面的dash - 代表標準輸入

在指令裡面,dash (-, 通常是按鍵0右邊那個)代表的是標準輸入(standard input):

  1. cat ERR194147.fastq.gz | pv | time seqtk fqchk -q 30 - 
  2. zcat ERR194147.fastq.gz | pv | time seqtk fqchk -q 30 -
  3. unpigz -p 4 -c ERR194147.fastq.gz | pv | time seqtk fqchk -q 30 -

2021年3月1日 星期一

從UCSC下載序列與註解

UCSC的基因體瀏覽頁面(UCSC Genome Browser),提供網頁版的圖形服務來看整個基因體。其底層所需的序列與註解存放於Sequence and Annotation Downloads


首頁就已經列出了最常下載的基因體

2021年2月1日 星期一

手動安裝FastQC-0.11.9到指定目錄

FastQC是一套用來看定序品質的軟體,用的是Java,所以首先要安裝Java Environment。在Debian8.8下面一個比較簡單的方式是先用下面指令安裝APT上面預設的fastqc,這樣就會自然地把環境給設定好。

Step 1:安裝好FastQC需要的環境

sudo apt install fastqc
sudo apt install libcommons-math3-java libjbzip2-java libsam-java picard-tools
java -version

這樣做完後會就會看到Java JDK的版本

java version "1.7.0_111"
OpenJDK Runtime Environment (IcedTea 2.6.7) (7u111-2.6.7-2~deb8u1)
OpenJDK 64-Bit Server VM (build 24.111-b01, mixed mode)

2021年1月1日 星期五

2019年12月27日 星期五

安裝bioSyntax到Sublime Text 3上

bioSyntax是一套幫生物文本資料上色的外掛套件,這邊介紹如何在Windows 10下幫Sublime Text 3這個文字編輯器安裝bioSyntax套件:
  1. 安裝Package Control到Sublime
  2. 開啟Sublime Text 3 並依照下面步驟依序執行
    • 工具列上面選 Preferences > Package Control
    • 選擇 Package Control: Install Package (看下圖、點圖放大)
    • 搜尋 bioSyntax,點選後會自動安裝
  3. 設定讓Windows 10預設用Sublime Text開啟fasta, fastq, bed, gtf, vcf, sam等檔案

2019年7月9日 星期二

bioSyntax: 為生物文本上色的plugin

bioSyntax:提供文字編輯器的plugin,幫助生物文本上色,可支援的文本

上面是sublime, vim, gedit, less等文字編輯器可看到~

2017年10月24日 星期二

用needle與water做序列比對

要比較兩條序列(pairwise sequence alignment),最常用的兩種方法:
  1. Needleman-Wunsch algorithm:做全域比對(global alignment)
  2. Smith-Waterman algorithm:做區域比對(local alignment)
要做也很簡單,只要安裝EMBOSS(The European Molecular Biology Open Software Suite),就會內建needlewater兩個程式。只要準備好兩條用fasta格式寫的序列a.fasta與b.fasta,使用下面的指令即可,結果會輸出到global.needlelocal.water這兩個檔案:
  1. needle -asequence a.fasta -bsequence b.fasta -auto -outfile global.needle
  2. water -asequence a.fasta -bsequence b.fasta -auto -outfile local.water
這邊-auto代表gap penalty相關的參數都用預設值。
若要直接輸出到標準輸出,那就將-outfile改成-stdout
  1. needle -asequence a.fasta -bsequence b.fasta -auto -stdout
  2. water -asequence a.fasta -bsequence b.fasta -auto -stdout
_EOF_

2016年11月5日 星期六

在Mac上安裝BLAST

在自己的Mac主機上跑BLAST,用下面的指令來安裝在/pkg資料夾下:
  1. cd /pkg
  2. wget ftp://ftp.ncbi.nlm.nih.gov/blast/executables/blast+/2.5.0/ncbi-blast-2.5.0+-x64-macosx.tar.gz
  3. tar zxf ~/Sources/ncbi-blast-2.5.0+-x64-macosx.tar.gz
  4. tree ncbi-blast-2.5.0+/