マウスのgskb遺伝子セットデータベース

3141 ワード

Gene Set Knowledgebase(GSKB)は、GSEAアルゴリズムのMSigDB(molecular signature database)を完全に借りて、データベースは、同じく有名なbroad開発であり、7種類に分けられている.
  • Gene Ontology
  • Curated pathways
  • Metabolic Pathways
  • Transcription Factor (TF)
  • microRNA target genes,
  • location (cytogenetics band)
  • others

  • 40以上の異なる知識データベースから収集・整理し,33261個の遺伝子セットを得た.
    gskbというRパッケージをインストールします
    PDFチュートリアルのインストールと表示:
    ## try http:// if https:// URLs are not supported
    source("https://bioconductor.org/biocLite.R")
    options(BioC_mirror="http://mirrors.ustc.edu.cn/bioc/")
    biocLite("gskb")
    library(gskb)
    browseVignettes("gskb")  
    biocLite("PGSEA")
    

    最新チュートリアル:https://bioconductor.org/packages/release/data/experiment/html/gskb.html
    組み込みデータセットの表示
    データセットは7つに分かれており、それぞれ表示できます.
    library(gskb) 
    data(mm_miRNA)
    mm_miRNA[[1]][1:10]
    
    mm_GO   Gene Ontology Data for Mouse
    mm_location Chromosomal Location Data for Mouse
    mm_metabolic    Metabolic Pathways Data for Mouse
    mm_miRNA    miRNA Target Genes Data for Mouse
    mm_other    Other Data for Mouse
    mm_pathway  Pathway Data for Mouse
    mm_TF   Transcription Factor Target Genes Data for Mouse
    

    このパッケージに格納されている遺伝子セットのフォーマットは、次のとおりです.
     [1] "MIRNA_MM_BETEL_MMU-LET-7A"                                                                        
     [2] "BETEL_MMU-LET-7A; Good mirSVR score Conserved; The microRNA.org resource: targets and expression."
     [3] "NSUN4"                                                                                            
     [4] "DCX"                                                                                              
     [5] "KCNK6"                                                                                            
     [6] "PBX1"                                                                                             
     [7] "PHF8"                                                                                             
     [8] "RACGAP1"                                                                                          
     [9] "EFHD2"                                                                                            
    [10] "DCBLD2"  
    

    最初の2つの元素は遺伝子ではないことがわかりますが、注意が必要ですよ.
    遺伝子セットの差異分析
    library(PGSEA)
    library(gskb)
    data(mm_miRNA)
    gse

    データセットのソース:https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE402612012年に発表されたHepatic gene expression changes following antisense oligonucleotide-based inhibition of miR-29 aについて
    この表現行列のサンプルは次のとおりです.
    > colnames(gse)
    [1] "GSM989360_Control1"         "GSM989361__Control2"        "GSM989362_Control3"        
    [4] "GSM989363__Control4"        "GSM989364_Anti.miR.29_rep1" "GSM989365_Anti.miR.29_rep1"
    [7] "GSM989366_Anti.miR.29_rep3" "GSM989367_Anti.miR.29_rep4"
    

    各遺伝子セットの各サンプルでの採点と、サンプルの記述情報があれば、下流分析を自由に行うことができます.