MSigDB:遺伝子セットデータベース


微信公衆番号「生信修練マニュアル」に注目してください.
Gene Set Enrichment Analysisは、中国語名が遺伝子セットリッチ分析であり、Broad Institute研究所の科学者によって提案されたリッチ方法であり、この方法を提案すると同時に分析を提供したソフトウェアGSEAと遺伝子セットデータベースMSigdbに対応している.本章は主にこのデータベースを紹介し、公式サイトは以下の通りである.
http://software.broadinstitute.org/gsea/msigdb/index.jsp humanの遺伝子については、位置、機能、代謝経路、標的結合など様々な角度から、多くの遺伝子集合が構築されており、1つの遺伝子集合のうち、位置や類似の機能を持つ多くの遺伝子が構築されており、Broad Institute研究所はそれらが構築した遺伝子集合をMSigDBデータベースに保存している.
このデータベースは絶えず更新され、完備されており、現在の最新バージョンはv 6である.2,2018年7月に更新され、17810個の遺伝子セットが収録された.異なるバージョンは以下のように収録された遺伝子セットの数が以下のように変化する.
MSigDB:基因集数据库_第1张图片このような多くのデータは、必ず分類された整理が必要であり、MSigDBでは、すべての遺伝子セットを以下の8つのカテゴリに分類する.
1. H: hallmark gene sets
このカテゴリは、複数の既知の遺伝子セットからなる超遺伝子セットを含み、各Hカテゴリの遺伝子セットは、複数のベースの他のカテゴリの遺伝子セットに対応する.例えばHALLMARK_ADIPOGENESISは36個の遺伝子セットに対応する.
2. C1: positional gene sets
このカテゴリは、ヒトの各染色体上の異なるcytoband領域に対応する遺伝子集合を含む.異なる染色体番号に基づいて二次分類を行う.
3. C2:curated gene sets
このカテゴリには既知のデータベース、文献、専門家がサポートする遺伝子セット情報が含まれており、以下の5つの2級分類MSigDB:基因集数据库_第2张图片を含む.KEGGを例にとると、186個の遺伝子セットが含まれており、各遺伝子セットは本質的にpathwayデータベースのパスに対応している.例えば、遺伝子セットKEGG_ABC_TRANSPORTERSはpathwayデータベースのhsa02010に対応する.
4. C3 : motif gene sets
このカテゴリはmiRNA標的遺伝子と転写因子結合領域などの遺伝子集合を含み、以下のように示す.
在这里插入图片描述転写因子もmiRNAも特定のmotif配列によって結合可能な領域を識別し、これらの遺伝子集合は本質的に同じmotif配列を有する遺伝子集合であり、例えばAAACCAC_MIR140という遺伝子集合は同じAAACCACmotifを有し、hsa-miR-140はこのmotifを識別して結合することができる.したがってAAACCAC_MIR140はhsa-miR-140標的遺伝子の集合である.
5. C4 : computational gene sets
このカテゴリには、コンピュータソフトウェアが予測した遺伝子の集合が含まれており、主に癌に関連する遺伝子であり、以下のように示されている.
在这里插入图片描述
6. C5 : GO gene sets
このカテゴリにはGene Ontology対応の遺伝子集合が含まれており,以下の3つのカテゴリに分類される.
MSigDB:基因集数据库_第3张图片各遺伝子セットは、例えば、遺伝子セットGO_MOLTING_CYCLE対応GO:0042303に対応するGO termに対応する.
7. C6 : oncogenic signatures
このカテゴリは、既知の条件処理後に遺伝子発現量が変化する遺伝子、例えばAKT_UP.V1_DNRAD 001試薬処理後に発現量が低下する遺伝子を含む.
8. C7 : immunologic signatures
このカテゴリには免疫系機能に関連する遺伝子の集合が含まれている.
公式サイトでは、これらの遺伝子セットを簡単に検索できます.リンクは以下の通りです.
http://software.broadinstitute.org/gsea/msigdb/genesets.jsp
興味のあるカテゴリを選択し、ページの一番下にそのカテゴリのすべての遺伝子セットが表示されます.
MSigDB:基因集数据库_第4张图片私が選んだのはC 1の大類で、2番染色体の遺伝子セット、chr2pこのような情報は各遺伝子セットの名前で、クリックして具体的な情報を見ることができて、例は以下のMSigDB:基因集数据库_第5张图片結果ページはこの遺伝子セットの名前、説明情報などを見ることができて、直接ダウンロードすることができて、多種のフォーマットが選択することができます.公式サイトではダウンロード機能も提供されており、すべての遺伝子セットを一度にダウンロードするには、登録して登録する必要があります.
GSEAにとって,富化解析アルゴリズムの一次向上だけでなく,研究角度の高度な昇華である.従来の富集分析はGO、pathwayなどの機能データベースだけを分析するが、MSigDBは多方位の研究構想を提供し、機能だけでなく、位置、表現量の変化傾向などの角度から探究することができ、富集分析の研究対象を極めて豊富に拡大した.
スキャンはマイクロ信号に注目して、もっとすばらしい内容はあなたを待っています!MSigDB:基因集数据库_第6张图片