ソフトclip&hard clip in CIGARを転載します。

2175 ワード

http://www.cnblogs.com/leezx/p/6105646.html clipped alignmentは照合の過程で、すべてのreadのシーケンスを使っていないので、readの2つの段のシーケンスが切り取られました。以下に示すように、つまりclip alignmentです。
Alignment:Read:ACGTGTGTA A-TCCGCCACG|𞓜𞓜124124; 124124; 124124; 124124; 124124; 124124; 124124;;124124;レフェレン:TAACGTGTCG
clipped alignmentに対応するのはspliced alignmentで、つまりreadの中間は対にならず、二段の割合が合っています。対応の表示は以下の通りです。
Altagment:Read:ACGTGC TAAGCTCATCC GCCACG|𞓜𞓜124124124; 124124; 124124; 124124; 124124124; 124124124; GT.124124; 124124124124;;124124124124;;;124124124124;;;124124124124;;;124124124124124;;;;124124124124124124;;;;;;124124124124124124;;;;;;;;;;124124124124124124124124124124124124124124124;;;;;;;;;;;124124124124124124124124124124124124124;;;;;;;;;;124124124124124124124124;;;;;;;;
clip alignmentに対応するCIGARは、S(soft clip)とH(hard clip)の2種類を表しています。BWA If the read has a chimeric alignmentに言及して、the paired or the top hit uss soft clipping and is marked with neither 0 x 800 nor 0 bits.All the other hit parts parts of the chimeric alignment will aligment will State will State will Stath th th th th th Market hand clipping Market and market Market Market Market and and
つまり、嵌合比が発見された場合には、最高の対top hitはソフトclippingとしてマークされ、残りはhard clippingとしてマークされる。
hard clipであれば、切り取った部分はSAMファイルに対応するreadには現れません(clipped sequences not present in SEQ)、soft clip(clipped sequences present in SEQ)であれば、出現します。
理解1:
Hard masked bases do not appar in the SEQ string,soft maked bases do.
So,if your cigar is:10H10M10H then the SEQ will only be 10 bases long.
if your cigar is 10 S 10 M 10 S the SEQ and base-quals will be 30 bases long.
まず、結果の展示方法に違いがあります。例えば、10 H 10 M 10 H、10列目の塩基配列は10 bpしか表示されません。また、10 S 10 M 10 Sであれば、30 bpのシーケンスが表示され、先頭と末尾の20 bpも同じである。
In the case of soft-masting,even though the SEQ is present,it is not used by variant calers and not displayed when You view.In eigther case,masted based shoud not usberge。
ソフトでは、表示されているシーケンスがhardより長いとしても、変異や可視化比を計算する場合には、これらのシーケンスは考慮されない。また、2つの場合にカバー度を計算すると、maskの塩基性は考えられません。
理解2:
同一のreads比が異なるchrに到達すると(嵌合reads)、hard clipの表示で表示される。例えば、上記の例では、R 1はそれぞれviralゲノムとchr 7に比べて(前の69 bpはviralに比べて、後ろの35はchr 7に比べて)、R 2はchr 7に比べています。