【ソフトウェア】変異コメントツール:annovar

4510 ワード

annovarは3つの注釈方式を提供します
一、遺伝子の注釈に基づいて与えられた変異は、変異がコードタンパク質の変化に影響するかどうかを見る遺伝子定義システムをサポートする:RefSeq genes,UCSC genes,ENSEMBL genes,GENCODE genes,AceView genes,or many other gene definition systems.
二、領域の注釈に基づいて変異がゲノムの特定の領域にあるかどうかを見る
三、フィルタリングされた注釈に基づいて、dbsnPなどの特定のデータベースに変異があるかどうかを見る
annotate_variation.plメインプログラムtable_annovar.pl常用注釈プログラム
キーパラメータ
—-buildver     ,  hg19
—-protocol    refGene, exac03

anno_refgene.sh

#!/bin/bash

name=$1
/rawdata/Zhangyu/software/ANNOVAR_latest/annovar/table_annovar.pl $name 
/rawdata/Zhangyu/software/ANNOVAR_latest/annovar/humandb 
-buildver hg19 
-otherinfo 
-remove 
-nastring . 
-protocol refGene 
-operation g 
--outfile ${name}.annovar

13 20797176 21105944 0 - comments: a 342kb deletion encompassing GJB6, associated with hearing loss

annovar_latest.sh

#!/bin/bash

name=huaxi-7.varscan.vcf
/rawdata/Zhangyu/software/ANNOVAR_latest/annovar/table_annovar.pl $name 
/rawdata/Zhangyu/software/ANNOVAR_latest/annovar/humandb 
-buildver hg19 
-otherinfo 
-remove 
-nastring . 
-protocol refGene,SAOdbSNP150,cosmic83,gnomad_exome,NovoDb_WES_2573,NovoDb_WGS_568,clinvar_20170905,HGMD,genomicSuperDups,gff3 
-operation g,f,f,f,f,f,f,f,r,r 
     
         
      【software】 :annovaran class="se">

      --gff3dbfile hg19_rmsk.gff 
      

      --vcfinput 
      

      --outfile 
      ${
      name
      }.annovar

     

TJクラスタannovarコメント

name=$1
/PUBLIC/software/HUMAN/ANNOVAR_2017Jun08/table_annovar.pl ./${name} 
/TJNAS01/OBD/Zhangyu/software/annovar_new_db_all_2019.1.8 
-buildver hg19 
-otherinfo 
-remove 
-nastring . 
-protocol refGene,avsnp150,SAOdbSNP150,1000g2015aug_all,exac03,esp6500siv2_all,gnomad_exome,NovoDb_WES_2573,NovoDb_WGS_568,cosmic83,clinvar_20170905,HGMD,ljb26_pp2hvar,ljb26_pp2hdiv,ljb26_sift,gerp++gt2,caddgt10,genomicSuperDups,gff3 
-operation g,f,f,f,f,f,f,f,f,f,f,f,f,f,f,f,f,r,r 
--gff3dbfile hg19_rmsk.gff 
--outfile ${name}.annovar

TJクラスタannovarコメント、inputはVCF

name=$1
/PUBLIC/software/HUMAN/ANNOVAR_2017Jun08/table_annovar.pl ./${name}.vcf 
/TJNAS01/OBD/Zhangyu/software/annovar_new_db_all_2019.1.8 
-buildver hg19 
-otherinfo 
-remove 
-nastring . 
-protocol refGene,avsnp150,SAOdbSNP150,1000g2015aug_all,exac03,esp6500siv2_all,gnomad_exome,NovoDb_WES_2573,NovoDb_WGS_568,cosmic83,clinvar_20170905,HGMD,ljb26_pp2hvar,ljb26_pp2hdiv,ljb26_sift,gerp++gt2,caddgt10,genomicSuperDups,gff3 
-operation g,f,f,f,f,f,f,f,f,f,f,f,f,f,f,f,f,r,r 
--gff3dbfile hg19_rmsk.gff 
--vcfinput 
--outfile ${name}.annovar

Indelの処理について


現在、indelの普遍的なアイデンティティを説明する方法はありません.
使用者として、(1)VCFファイルを分割して、各行に1つの変異しか含まれていないことを確保する.(2)left-normalizeのすべてのVCFファイル;(3)ANNOVARコメントの使用
コマンドを使用します.
bcftools norm -m-both -o ex1.step1.vcf ex1.vcf.gz

bcftools norm -f human_g1k_v37.fasta -o ex1.step2.vcf ex1.step1.vcf

1番目のコマンド分割マルチallels変異は個別の行に検出され、2番目のコマンドは真のleft-normalizationを実行します.(ファイルにこれらの変異があるにもかかわらず、最初のコマンドが変異なしで分解される場合があります.この場合、vtプログラムを使用して置き換えることができます)
参照先:
ANNOVARによる突然変異コメント
-END-