MSigDB:遺伝子セットデータベース
5002 ワード
微信公衆番号「生信修練マニュアル」に注目してください.
Gene Set Enrichment Analysisは、中国語名が遺伝子セットリッチ分析であり、Broad Institute研究所の科学者によって提案されたリッチ方法であり、この方法を提案すると同時に分析を提供したソフトウェア
http://software.broadinstitute.org/gsea/msigdb/index.jsp
このデータベースは絶えず更新され、完備されており、現在の最新バージョンはv 6である.2,2018年7月に更新され、17810個の遺伝子セットが収録された.異なるバージョンは以下のように収録された遺伝子セットの数が以下のように変化する.
このような多くのデータは、必ず分類された整理が必要であり、
1. H: hallmark gene sets
このカテゴリは、複数の既知の遺伝子セットからなる超遺伝子セットを含み、各
2. C1: positional gene sets
このカテゴリは、ヒトの各染色体上の異なるcytoband領域に対応する遺伝子集合を含む.異なる染色体番号に基づいて二次分類を行う.
3. C2:curated gene sets
このカテゴリには既知のデータベース、文献、専門家がサポートする遺伝子セット情報が含まれており、以下の5つの2級分類
を含む.
4. C3 : motif gene sets
このカテゴリはmiRNA標的遺伝子と転写因子結合領域などの遺伝子集合を含み、以下のように示す.
転写因子もmiRNAも特定のmotif配列によって結合可能な領域を識別し、これらの遺伝子集合は本質的に同じmotif配列を有する遺伝子集合であり、例えば
5. C4 : computational gene sets
このカテゴリには、コンピュータソフトウェアが予測した遺伝子の集合が含まれており、主に癌に関連する遺伝子であり、以下のように示されている.
6. C5 : GO gene sets
このカテゴリにはGene Ontology対応の遺伝子集合が含まれており,以下の3つのカテゴリに分類される.
各遺伝子セットは、例えば、遺伝子セット
7. C6 : oncogenic signatures
このカテゴリは、既知の条件処理後に遺伝子発現量が変化する遺伝子、例えば
8. C7 : immunologic signatures
このカテゴリには免疫系機能に関連する遺伝子の集合が含まれている.
公式サイトでは、これらの遺伝子セットを簡単に検索できます.リンクは以下の通りです.
http://software.broadinstitute.org/gsea/msigdb/genesets.jsp
興味のあるカテゴリを選択し、ページの一番下にそのカテゴリのすべての遺伝子セットが表示されます.
私が選んだのはC 1の大類で、2番染色体の遺伝子セット、
結果ページはこの遺伝子セットの名前、説明情報などを見ることができて、直接ダウンロードすることができて、多種のフォーマットが選択することができます.公式サイトではダウンロード機能も提供されており、すべての遺伝子セットを一度にダウンロードするには、登録して登録する必要があります.
GSEAにとって,富化解析アルゴリズムの一次向上だけでなく,研究角度の高度な昇華である.従来の富集分析はGO、pathwayなどの機能データベースだけを分析するが、
スキャンはマイクロ信号に注目して、もっとすばらしい内容はあなたを待っています!
Gene Set Enrichment Analysisは、中国語名が遺伝子セットリッチ分析であり、Broad Institute研究所の科学者によって提案されたリッチ方法であり、この方法を提案すると同時に分析を提供したソフトウェア
GSEA
と遺伝子セットデータベースMSigdb
に対応している.本章は主にこのデータベースを紹介し、公式サイトは以下の通りである.http://software.broadinstitute.org/gsea/msigdb/index.jsp
human
の遺伝子については、位置、機能、代謝経路、標的結合など様々な角度から、多くの遺伝子集合が構築されており、1つの遺伝子集合のうち、位置や類似の機能を持つ多くの遺伝子が構築されており、Broad Institute研究所はそれらが構築した遺伝子集合をMSigDB
データベースに保存している.このデータベースは絶えず更新され、完備されており、現在の最新バージョンはv 6である.2,2018年7月に更新され、17810個の遺伝子セットが収録された.異なるバージョンは以下のように収録された遺伝子セットの数が以下のように変化する.

MSigDB
では、すべての遺伝子セットを以下の8つのカテゴリに分類する.1. H: hallmark gene sets
このカテゴリは、複数の既知の遺伝子セットからなる超遺伝子セットを含み、各
H
カテゴリの遺伝子セットは、複数のベースの他のカテゴリの遺伝子セットに対応する.例えばHALLMARK_ADIPOGENESIS
は36個の遺伝子セットに対応する.2. C1: positional gene sets
このカテゴリは、ヒトの各染色体上の異なるcytoband領域に対応する遺伝子集合を含む.異なる染色体番号に基づいて二次分類を行う.
3. C2:curated gene sets
このカテゴリには既知のデータベース、文献、専門家がサポートする遺伝子セット情報が含まれており、以下の5つの2級分類

KEGG
を例にとると、186個の遺伝子セットが含まれており、各遺伝子セットは本質的にpathwayデータベースのパスに対応している.例えば、遺伝子セットKEGG_ABC_TRANSPORTERS
はpathwayデータベースのhsa02010
に対応する.4. C3 : motif gene sets
このカテゴリはmiRNA標的遺伝子と転写因子結合領域などの遺伝子集合を含み、以下のように示す.

AAACCAC_MIR140
という遺伝子集合は同じAAACCAC
motifを有し、hsa-miR-140はこのmotifを識別して結合することができる.したがってAAACCAC_MIR140
はhsa-miR-140標的遺伝子の集合である.5. C4 : computational gene sets
このカテゴリには、コンピュータソフトウェアが予測した遺伝子の集合が含まれており、主に癌に関連する遺伝子であり、以下のように示されている.

6. C5 : GO gene sets
このカテゴリにはGene Ontology対応の遺伝子集合が含まれており,以下の3つのカテゴリに分類される.

GO_MOLTING_CYCLE
対応GO:0042303
に対応するGO termに対応する.7. C6 : oncogenic signatures
このカテゴリは、既知の条件処理後に遺伝子発現量が変化する遺伝子、例えば
AKT_UP.V1_DN
RAD 001試薬処理後に発現量が低下する遺伝子を含む.8. C7 : immunologic signatures
このカテゴリには免疫系機能に関連する遺伝子の集合が含まれている.
公式サイトでは、これらの遺伝子セットを簡単に検索できます.リンクは以下の通りです.
http://software.broadinstitute.org/gsea/msigdb/genesets.jsp
興味のあるカテゴリを選択し、ページの一番下にそのカテゴリのすべての遺伝子セットが表示されます.

chr2p
このような情報は各遺伝子セットの名前で、クリックして具体的な情報を見ることができて、例は以下の
GSEAにとって,富化解析アルゴリズムの一次向上だけでなく,研究角度の高度な昇華である.従来の富集分析はGO、pathwayなどの機能データベースだけを分析するが、
MSigDB
は多方位の研究構想を提供し、機能だけでなく、位置、表現量の変化傾向などの角度から探究することができ、富集分析の研究対象を極めて豊富に拡大した.スキャンはマイクロ信号に注目して、もっとすばらしい内容はあなたを待っています!
