在主页的Help栏目下,点击Downloads进入下载页面,往下拉,找到需要下载的文件。有两种下载方式:一种是浏览器下载,另一种是命令行下载,这里介绍第二种。
运行以下curl命令,会返回一个json文件,该文件包含了要下载的文件的真实地址,再通过curl命令下载,得到的CosmicMutantExport.tsv.gz即是需要的Cosmic记录数据库。
至于为什么要下载这3个文件,请看Annovar官方网站的介绍:
先解压:
gunzip-cCosmicMutantExport.tsv.gz>CosmicMutantExport.tsvgunzip-cCosmicCodingMuts.normal.vcf.gz>CosmicCodingMuts.normal.vcfgunzip-cCosmicNonCodingVariants.normal.vcf.gz>CosmicNonCodingVariants.normal.vcf下载制作Annovar数据库的脚本:
#制作编码区Cosmic数据库perlprepare_annovar_user.pl--dbtypecosmicCosmicMutantExport.tsv-vcfCosmicCodingMuts.normal.vcf>hg19_cosmic95_coding.txt#排序,因为上述命令得到的数据库是无序的,按染色编号进行排序sort-k1,1V-k2,2n-k3,3nhg19_cosmic95_coding.txt>hg19_cosmic95_coding_sort.txt#用排序后的数据库替换未排序的,hg19_cosmic95_coding.txt即为最终的编码区的Cosmic数据库,可供Annovar程序使用mvhg19_cosmic95_coding_sort.txthg19_cosmic95_coding.txt#制作非编码区的Cosmic数据库,跟编码区的一样perlprepare_annovar_user.pl--dbtypecosmicCosmicMutantExport.tsv-vcfCosmicNonCodingVariants.normal.vcf>hg19_cosmic95_noncoding.txtsort-k1,1V-k2,2n-k3,3nhg19_cosmic95_noncoding.txt>hg19_cosmic95_noncoding_sort.txtmvhg19_cosmic95_noncoding_sort.txthg19_cosmic95_noncoding.txt制作数据库索引通常,Annovar的数据库如果比较大,需要先建立索引文件后再使用,但是对于cosmic数据库,官网有一句:
Userscannotindexthefile,butthefilesizeisnottoolarge,andyoudonotneedtouseindexingtouseANNOVAR.
就是,库不算大,不建索引也挻快,那就干脆省略这一步。
运行以下命令测试:
ID=COSV58736910;OCCURENCE=2(thyroid)ID=COSV100633201;OCCURENCE=1(skin)ID=COSV58736947;OCCURENCE=1(large_intestine)ID=COSV100633198;OCCURENCE=1(stomach)ID=COSV58736924;OCCURENCE=1(thyroid)ID=COSV58737059;OCCURENCE=2(skin)