【ソフトウェア】変異コメントツール:annovar
4510 ワード
annovarは3つの注釈方式を提供します
一、遺伝子の注釈に基づいて与えられた変異は、変異がコードタンパク質の変化に影響するかどうかを見る遺伝子定義システムをサポートする:RefSeq genes,UCSC genes,ENSEMBL genes,GENCODE genes,AceView genes,or many other gene definition systems.
二、領域の注釈に基づいて変異がゲノムの特定の領域にあるかどうかを見る
三、フィルタリングされた注釈に基づいて、dbsnPなどの特定のデータベースに変異があるかどうかを見る
annotate_variation.plメインプログラムtable_annovar.pl常用注釈プログラム
キーパラメータ
13 20797176 21105944 0 - comments: a 342kb deletion encompassing GJB6, associated with hearing loss
現在、indelの普遍的なアイデンティティを説明する方法はありません.
使用者として、(1)VCFファイルを分割して、各行に1つの変異しか含まれていないことを確保する.(2)left-normalizeのすべてのVCFファイル;(3)ANNOVARコメントの使用
コマンドを使用します.
1番目のコマンド分割マルチallels変異は個別の行に検出され、2番目のコマンドは真のleft-normalizationを実行します.(ファイルにこれらの変異があるにもかかわらず、最初のコマンドが変異なしで分解される場合があります.この場合、vtプログラムを使用して置き換えることができます)
参照先:
ANNOVARによる突然変異コメント
-END-
一、遺伝子の注釈に基づいて与えられた変異は、変異がコードタンパク質の変化に影響するかどうかを見る遺伝子定義システムをサポートする:RefSeq genes,UCSC genes,ENSEMBL genes,GENCODE genes,AceView genes,or many other gene definition systems.
二、領域の注釈に基づいて変異がゲノムの特定の領域にあるかどうかを見る
三、フィルタリングされた注釈に基づいて、dbsnPなどの特定のデータベースに変異があるかどうかを見る
annotate_variation.plメインプログラムtable_annovar.pl常用注釈プログラム
キーパラメータ
—-buildver , hg19
—-protocol refGene, exac03
anno_refgene.sh
#!/bin/bash
name=$1
/rawdata/Zhangyu/software/ANNOVAR_latest/annovar/table_annovar.pl $name
/rawdata/Zhangyu/software/ANNOVAR_latest/annovar/humandb
-buildver hg19
-otherinfo
-remove
-nastring .
-protocol refGene
-operation g
--outfile ${name}.annovar
13 20797176 21105944 0 - comments: a 342kb deletion encompassing GJB6, associated with hearing loss
annovar_latest.sh
#!/bin/bash
name=huaxi-7.varscan.vcf
/rawdata/Zhangyu/software/ANNOVAR_latest/annovar/table_annovar.pl $name
/rawdata/Zhangyu/software/ANNOVAR_latest/annovar/humandb
-buildver hg19
-otherinfo
-remove
-nastring .
-protocol refGene,SAOdbSNP150,cosmic83,gnomad_exome,NovoDb_WES_2573,NovoDb_WGS_568,clinvar_20170905,HGMD,genomicSuperDups,gff3
-operation g,f,f,f,f,f,f,f,r,r
【software】 :annovaran class="se">
--gff3dbfile hg19_rmsk.gff
--vcfinput
--outfile
${
name
}.annovar
TJクラスタannovarコメント
name=$1
/PUBLIC/software/HUMAN/ANNOVAR_2017Jun08/table_annovar.pl ./${name}
/TJNAS01/OBD/Zhangyu/software/annovar_new_db_all_2019.1.8
-buildver hg19
-otherinfo
-remove
-nastring .
-protocol refGene,avsnp150,SAOdbSNP150,1000g2015aug_all,exac03,esp6500siv2_all,gnomad_exome,NovoDb_WES_2573,NovoDb_WGS_568,cosmic83,clinvar_20170905,HGMD,ljb26_pp2hvar,ljb26_pp2hdiv,ljb26_sift,gerp++gt2,caddgt10,genomicSuperDups,gff3
-operation g,f,f,f,f,f,f,f,f,f,f,f,f,f,f,f,f,r,r
--gff3dbfile hg19_rmsk.gff
--outfile ${name}.annovar
TJクラスタannovarコメント、inputはVCF
name=$1
/PUBLIC/software/HUMAN/ANNOVAR_2017Jun08/table_annovar.pl ./${name}.vcf
/TJNAS01/OBD/Zhangyu/software/annovar_new_db_all_2019.1.8
-buildver hg19
-otherinfo
-remove
-nastring .
-protocol refGene,avsnp150,SAOdbSNP150,1000g2015aug_all,exac03,esp6500siv2_all,gnomad_exome,NovoDb_WES_2573,NovoDb_WGS_568,cosmic83,clinvar_20170905,HGMD,ljb26_pp2hvar,ljb26_pp2hdiv,ljb26_sift,gerp++gt2,caddgt10,genomicSuperDups,gff3
-operation g,f,f,f,f,f,f,f,f,f,f,f,f,f,f,f,f,r,r
--gff3dbfile hg19_rmsk.gff
--vcfinput
--outfile ${name}.annovar
Indelの処理について
現在、indelの普遍的なアイデンティティを説明する方法はありません.
使用者として、(1)VCFファイルを分割して、各行に1つの変異しか含まれていないことを確保する.(2)left-normalizeのすべてのVCFファイル;(3)ANNOVARコメントの使用
コマンドを使用します.
bcftools norm -m-both -o ex1.step1.vcf ex1.vcf.gz
bcftools norm -f human_g1k_v37.fasta -o ex1.step2.vcf ex1.step1.vcf
1番目のコマンド分割マルチallels変異は個別の行に検出され、2番目のコマンドは真のleft-normalizationを実行します.(ファイルにこれらの変異があるにもかかわらず、最初のコマンドが変異なしで分解される場合があります.この場合、vtプログラムを使用して置き換えることができます)
参照先:
ANNOVARによる突然変異コメント
-END-