UCSC的基因體瀏覽頁面(UCSC Genome Browser),提供網頁版的圖形服務來看整個基因體。其底層所需的序列與註解存放於Sequence and Annotation Downloads:
- Current genomes:依照學名來下載基因體
- REST API data interface:用JSON格式找資料後用API下載
- Table Browser:註解下載的地方,看一下describe table schema
- GenArk:Genome Archive,根據分類去找基因體
- Human:人的基因體,包含了hg38, hg19, ... 以GRCh38/hg38為例
- 完整的人基因體載點:這裡可找到hg38.fa.gz (938M)
- 依照hg38染色體下載:chr1.fa.gz, ..., chrX.fa.gz, chrY.fa.gz, chrM.fa.gz
- GRCh38 Patche 13:
- Mouse:小鼠的基因體,包含了mm39, mm10, ..., 以GRCm39/mm39為例
- 完整的小鼠基因體載點:找到mm39.fa.gz (830M)
- 依照mm39染色體下載:chr1, ..., chr19, chrX, chrY, chrM
- Mammals:哺乳類,像是貓felCat9、狗canFam6、貂musFur1, ...
- Other vertebrates:其他脊椎動物,像是雞galGal6、斑馬魚danRer11, ...
- ...:
- Other genomes:像是SARS-CoV-2 (wuhCor1)
相關資料
- UCSC Genome Browser Acknowledgments:Credit資訊
- Human genome data sources裡面有很有趣的資訊
- 列出hg19定序的單位,還有AGP file應該是提供者的名字
_EOF_
沒有留言:
張貼留言