現在、生物医学研究が情報計算技法と資源に依存する度合いは、急激に増大している。とくにがん、メタボリック症候群、うつ病や神経変性症、炎症や大規模感染症などへの取り組みには、基礎研究段階から、治療方法の開発、予防や実践医療、予後対策に至るまで、ITを活用し、情報計算の専門家の協力をうることが、重要な戦略になっている。こうした潮流の中で、疾患の理解や治療法の開発も、これまでのような単一遺伝子や単一のタンパク質を基礎にしたものから、経路網 Pathway/Network と呼ばれる、分子間の相互作用を基盤とした知識を基礎にするものに変化してきている。こうした情報や知識の多くは、特定の医療や健康の問題に依存していることもあるが、依存しておらず、複数の領域に共通であることも少なくない。
   この情報計算基盤Informational and Computational Platformは、生物医学研究に共通する基盤的なゲノム、遺伝子、タンパク質、経路網の情報知識、さらには計算技法や計算資源を利用するための案内役となることを目的としている。そうした情報計算資源には、多くの国際的かつ先端的な生物医学研究機関で開発され、インターネット経由で無償で利用できるようになっているものが少なくない。さらに、そのような情報知識の提供機関は増え続け、それらの内容は日々更新されている。しかし残念ながら、それらは専門的であり、細分化されているため、その存在を知ることも、利用することも、慣れない者にとっては、そう簡単なこと   ではない。
この情報計算基盤は、進歩と変化の激しい生物医学研究を支援する、基盤的な情報計算資源、データベースや知識ベース、多様な計算化学や情報学的な計算技法、計算資源や計算環境などを紹介するとともに、それらを利用、活用するための案内情報や、入門的教育的な知識や演習問題を提供することを目的としている。
   この情報計算基盤の内容は、開発責任者が、CBI学会(情報計算化学生物学会)の運営や、広島大学、東京医科歯科大学、神戸大学などにおけるJSTによる人材養成プログラムに関わった経験を踏まえ、協力者とともに試験的に作成しているものである。

I.基盤的なデータおよび知識ベース

1.Genes/Genomes

   生物医学研究のための情報計算資源を提供している機関の中でも最も一般的な性格を備えているのは、NCBIである。多くの研究機関で分散的に解読されている多様なゲノムデータを最も効率的に閲覧できるのは、Genome Browser機能を備えたUCSC(University of California, Santa Cruz)とEnsemblが提供しているシステムである。Wellcome Trustもゲノム情報を提供している。
  • NCBI http://www.ncbi.nlm.nih.gov/
  • The Human Genome: Your Genes, Your Health, Your Future http://www.gate2biotech.com/human-genome-your-genes-your-health-your/ A comprehensive resource on the human genome, its role in health and medicine, and the broader social impact of unravelling its mysteries; produced by the Wellcome Trust.
  • UCSC Genome Browser http://genome.ucsc.edu/cgi-bin/hgGateway
  • Ensembl http://www.ensembl.org/
  • ENCODE (Encyclopedia of DNA Elements)  http://www.genome.gov/10005107
    Project launched by the National Human Genome Research Institute (NHGRI) that aims to identify all functional elements in the human genome sequence.
その他の参考サイト
  • GeneCards http://nciarray.nci.nih.gov/cards/
  • Bioinformatic Harvester http://harvester.embl.de/
  • AceView http://www.ncbi.nih.gov/IEB/Research/Acembly/index.html
  • Sanger Mitochondrion genome www.mitomap.org/
  • Human Genome Resources (NCBI) http://www.ncbi.nlm.nih.gov/projects/genome/guide/human/
  • GenBank (NCBI) http://www.ncbi.nlm.nih.gov/Genbank
  • Map Viewer(NCBI) human http://www.ncbi.nlm.nih.gov/mapview/map_search.cgi?taxid=9606
  • DDBJ http://www.ddbj.nig.ac.jp/Welcome-j.html
  • GeneNet http://wwwmgs.bionet.nsc.ru/mgs/gnw/genenet/
  • Human-Mouse Homology Map http://www.ncbi.nlm.nih.gov/Homology/
  • Mouse Genome Database http://mgd.informatics.jax.org/
  • MITOMAP http://www.mitomap.org/
  • KEGG GeneDatabase http://www.genome.jp/kegg/docs/upd_genes.html
  • H-InvDB; http://www.h-invitational.jp/ a comprehensive annotation resource for human genes and transcripts
Tool
  • THE MEME/MAST SYSTEM http://meme.nbcr.net/meme/
    The MEME/MAST system allows you to discover motifs (highly conserved regions) in groups of related DNA or protein sequences using MEME and, search sequence databases using motifs using MAST

2.Genetic/Genomic Variation Data

  • Stephen F. Kingsmor Genome-wide association studies: progress and potential for drug discovery and developmente, Nature Reviews Drug Discovery, 7: 221-230, 2008.
   Although genetic studies have been critically important for the identification of therapeutic targets in Mendelian disorders, genetic approaches aiming to identify targets for common, complex diseases have traditionally had much more limited success. However, during the past year, a novel genetic approach - genome-wide association (GWA) - has demonstrated its potential to identify common genetic variants associated with complex diseases such as diabetes, inflammatory bowel disease and cancer. Here, we highlight some of these recent successes, and discuss the potential for GWA studies to identify novel therapeutic targets and genetic biomarkers that will be useful for drug discovery, patient selection and stratification in common diseases.
  • Human Genetic Variation: An NIH Curriculum Supplement A creative, inquiry-based instruction program, designed to promote active learning and stimulate student interest in medical topics.
  • SNPs: A Science Primer An introduction to single nucleotide polymorphisms, provided by the National Center for Biotechnology Information. Single Nucleotid Polymorphisms(SNPs、一塩基多型)とは、ある塩基がある集団におけて数%程度(1%あるいは5%)違っている変化である。およそ1kbに1個の割合で存在すると推定すると、ヒトの30億塩基のゲノムでは、30万塩基で変化が見られると推定される。製薬企業GSK1997/8年に、こうした変化のデータ収集のためのConsortiumの結成を呼びかけた。
  • SNPedia A web site for sharing information about the effects of DNA variations on traits and disease.
  • Copy Number Variation CNV: Copy Number Variationのデータが蓄積され、SNPsとともに、DNA塩基配列の多様性の指標として、遺伝学、疾患の理解、集団の遺伝的な特性把握などに重要であると考えられるようになった R. Redon, et al. Global variation in copy number in the human genome. Nature 444, 444-454, 2006. M.Skipper Genomics, Copy number variation map, Nature Reviews Genetics 8: 2, January 2007
   International HapMap Project A multi-country effort to identify and catalog genetic similarities and differences in human beings.
  • HapMap計画
    The International HapMap Consortium, The International HapMap Project, Nature, 426(18): 789-796, 2003. The International HapMap Consortium, A haplotype map of the human genome, Nature, 437(27): 1299-1320, 2005.
  • HapMap計画の成果の利用
    A. Helgadottir et al., A variant of the gene encoding leukotriene A4 hydrolase confers ethnicity-specific risk of myocardial infarction, Nature Genetics, 38: 68-74, 2006 M.J. Rieder et al. Effect of VKORC1 Haplotypes on Transcriptional Reulgation and Warfarin Dose, NEJM 352: 2285-2293, 2005.

↑TOPへ

3.Genotype-Phenotype Database

  • NCBI Genes and Disease
    (www.ncbi.nlm.nih.gov/books/bv.fcgi?rid=gnd&ref=sidebar)
  • OMIM-Online Mendelian Inheritance in Man 
    http://www.ncbi.nlm.nih.gov/sites/entrez?db=omim
  • Human Mutation Database (www.hgmd.org)
  • Human Gene Mutation Database(http://www.hgmd.org/)
  • HUGO Mutation Database Initiative (www.genomic.unimelb.edu.au/mdi/HGMD)
  • Database of Genotype and Phenotype (dbGaP)
    (http://www.ncbi.nlm.nih.gov/entrez/query.fcgi?db=gap)

    NLM/NIH は genome wide association (GWA) studies のデータを収集、提供するためのデータベース構築に着手した。The database of Genotype and Phenotype (dbGaP) was developed to archive and distribute the results of studies that have investigated the interaction of genotype and phenotype. Such studies include genome-wide association studies, medical sequencing, molecular diagnostic assays, as well as association between genotype and non-clinical traits. The advent of high-throughput, cost-effective methods for genotyping and sequencing has provided powerful tools that allow for the generation of the massive amount of genotypic data required to make these analyses possible.

  • 現在提供中のデータベース
  • the Age-Related Eye Diseases Study (AREDS)
  • Parkinsonism Study
いわゆるCommon Diseaseの原因遺伝子のデータベースについては、がんと肥満ではまとめられているが、その他の疾患はまだのようである。
  • Caner Gene Census (www.sanger.ac.uk/genetics/CGP/Census)
  • The Human Obesity Gene Map (obesitygene.pbrc.edu/)
  • Genome Medicine Database of Japan (GeMDBJ)
    (gemdbj.nibio.go.jp/dgdb/SearchDisease.do;jsessionid=3D230E26A79BB4B49834962B6E4D496A)
  • Genetic Association Information Network (GAIN)
    A public-private partnership that aims to understand the genetic factors influencing risk for complex diseases.

4.Protein

  • PDB http://www.rcsb.org/pdb/
  • CATH Protein Structure Classification Database (UCL) http://www.cathdb.info/
  • PROSITE(ExPASy) http://au.expasy.org/prosite/
  • InterPro http://www.ebi.ac.uk/interpro/
  • BLOCKS http://blocks.fhcrc.org/
  • Pfam http://pfam.sbc.su.se:43210/
    The Pfam database is a large collection of protein families, each represented by multiple sequence alignments and hidden Markov models (HMMs).
  • F. M. G. Pearl et al., The CATH database: an extended protein family resource for structural and functional genomics, Nucleic Acids Research, Vol. 31, No. 1: 452-455、2003.
  • FSS
    Liisa Holm and Chris Sander、The FSSP database of structurally aligned protein fold Families, 3600-3609 Nucleic Acids Research, 1994, Vol. 22, No. 17
  • Liisa Holm and Chris Sander, Dali/FSSP classification of three-dimensional protein Folds, Nucleic Acids Research, 1997, Vol. 25, No. 1 231-234

5.Carbohydrate, Sugar, Lipid

  • Carbohydrate
    Glycoconjugate Data Bank http://www.glycostructures.jp/index/documents
  • Sugar
    糖鎖関連遺伝子データベース(GGDB)http://riodb.ibase.aist.go.jp/rcmg/ggdb/
  • Lipid
    LIPID MAP - Metabolites And Pathways Strategy Consortium
    http://www.lipidmaps.org
    このサイトは、NIH/NIGM(National Institute of General Medicine)に支援されたMetabolites And Pathways Strategy Consortiumによって構築されているlipidについても統合的な情報計算資源であり、脂質代謝物lipid metabolitesについてのあらゆる情報を網羅することをめざしている。これには脂質分子の名称、構造、標準脂質、脂質代謝の経路、分析装置、分析ソフトウエア、論文などが閲覧できるようになっている。
  • The GOLD.db https://gold.tugraz.at/
    The GOLD.db was developed to address the need to integrate disparate information on the function and properties of genes and their protein products that are particularly relevant to the biology, diagnosis management, treatment, and prevention of lipid-associated disorders including non-insulin dependent diabetes, various hyperlipidemias, high blood pressure and atherosclerosis.

↑TOPへ


Ⅱ.Omicsデータの解析と解釈のための情報計算資源Omics Data Analysis

    核内受容体の研究でも、メタボリック症候群の研究でも、 いまやDNAチップやマイクロアレイMicroarrayを使ったTrancriptome解析や、プロテオミックスProteomics、メタボロミックスMetabolomicsが広く使われている。そうした実験で生成されるデータは膨大で、人手による扱いはもちろん、解釈でさえ計算機に頼らざるをえない状況になっている。そのために、そうしたデータの収集、解析、蓄積などのためのソフトウエアやパケージ・ソフトが多数開発されており、それらを使いこなすBioinformaticsの専門家も増えている。なお、このサイトの情報は、2005-2006年頃のものであり、新しい情報によって更新する予定である。

データ解析の全体構造
   Omicsデータの解析に限らず、一般に科学的なデータ解析のための情報計算資源の区分と相互関係は、下記の図で表現できる。以下では、この区分にしたがって、情報計算資源を紹介する。したがって、一般にOmicsと呼ばれるDNAチップあるいはマイクロアレイデータ解析でも、Proteomicsでも、あるいはMetabolomicsでも、その処理は、統計解析の視点から見ると共通したところが多い。

1.代表的な解析ツール

  • ArrayMaker : Jaseph Derisi Lab. http://derisilab.ucsf.edu/arraymaker.shtml
  • BioConductor : open source and open software http://www.bioconductor.org/
  • BRB ArrayTools(NCI) http://linus.nci.nih.gov/BRB-ArrayTools.html
  • dCHIP : w. H. Wong Lab. http://biosun1.harvard.edu/complab/dchip/
  • Functional Genomics : My Microarray Software comparison http://ihome.cuhk.edu.hk/~b400559/arraysoft.html
  • GENECLUSTER http://www.broad.mit.edu/cancer/software/genecluster2/gc2.html
  • GenePattern http://www.broad.mit.edu/cancer/software/genepattern/
  • GeneRnge http://www.ebi.ac.uk/research/cgg/services/rage/
  • GeneX http://www.ncgr.org/research/genex/
  • guide for microarray : Pat Brown Lab. http://cmgm.stanford.edu/pbrown/
  • Software for microarrays : Michael Eisen Lab. http://rana.lbl.gov/
  • NIH Microarray Project http://research.nhgri.nih.gov/microarray/
  • TIGR functional genomics http://www.tigr.org/microarray/
  • TIGR MeV http://www.tm4.org/mev.html
  • Microarray Resources : Software & Tools
    http://genome-www5.stanford.edu/resources/restech.shtml

2.オミックスデータの入手

2.1 Omics Data Repository site
    オミックスのデータは再現性に乏しいこと、解析よりも解釈が難しいことなどから、相互に比較して結果を検証する必要があることが広く認識されるようになってきた。これに伴い、オミックスデータをインターネット上の公開サイトに寄託Repositoryする試みが始まっている。このようなデータが公開されれば、実験家だけでなく、Algorithmの開発関心のある理論や計算の専門家にも有用な資料となる。こうした試みが先行しているのはMicroarrayであり、次に議論がされたのがProteomicsであり、多少遅れ気味なのがMetabolomicsである。
2.2 Microarray data
2.2.1 Microarray dataの寄託サイト案内
マイクロアレイデータの寄託サイトはすでに多数あるが、下記はそれらの案内サイトである。
  • Public Microarray Database and Gene Expression Database
    http://ihome.cuhk.edu.hk/~b400559/arraysoft_public.html#Definition%20of%20public%20microarray
MGED (Microarray Gene Expression Data Society)
特定の疾患領域ごとにデータを集めているサイトもある。もっとも多いのはがんであるが、他の疾患もある。
  • CardioGenomics : FVB benchmark data set for cardic deveropment, maturation, and aging : http://cardiogenomics.med.harvard.edu/home
研究論文によっては、元データが見られるものもある。こうした論文は教育的である。
  • Simon X. Liang et al., "Gene Expression Profiling and Localization of Hoechst-effluxing CD45- and CD45+ Cells in the Embryonic Mouse Lung", Physiol. Genomics 23: 172-181, 2005
  • Bina Joe et al., "Transcriptional profiling with a blood pressure QTL interval-specific oligonucleotide array ", Physiol. Genomics 23: 318-326, 2005
2.2.2 マイクロアレイデータベースの例
これも多数あるが、以下のその例である。
  • Arrayexpress : (EBI) http://www.ebi.ac.uk/arrayexpress/
  • GEO (Gene Expression Omnibus) : NCBI http://www.ncbi.nlm.nih.gov/geo/
  • MAD (Microarray Database) : The Jackson Laboratory http://mad.jax.org/
  • MGED (Microarray Gene Expression Data) Society http://www.mged.org/
  • SMD (Stanford Microarray Database http://genome-www5.stanford.edu/
  • YMD (Yale Microarray Database) http://info.med.yale.edu/microarray/
2.3 Proteomicsのデータ登録システム
これに関しては、総合的な案内サイトではないが、下記が参考になる。
  • The Proteios Project: http://www.proteios.org/more.shtml
  • S. Orchard, H.Hermjakob, R. Apweiler, The Proteomics Standards Initiative, Proteome, 3(7): 1375-1376, 2003.
2.4 Metabolomicsデータの登録

↑TOPへ

3.入手したデータの前処理と蓄積

   公開サイトから入手したデータはそのままでは自らの解析や解釈に使えない。まず、自らの環境で扱えるように加工(前処理)を施す必要がある。この処理は、実験データがどのように記録されたかということと関係しているため、実験系に依存することなる。例えば、Affymetrix社のOligochipを使った実験データの場合には、同社特有のChip構築法(Probeの並べ方など)と統計的な処理方式に依存した前処理方式が専用のソフトとして用意されている。 前処理したデータは、標準的な形式(例えばEXCELL)のファイルや、データベース(例えばMySQL)などとして蓄積される。

4.普遍的な統計、データ解析技法

   Omicsデータの解析には、統計学やパターン認識やデータ解析など、普遍的な思考支援技法としてすでに開発されている標準的な手法が多数使われている。これらは統計的な検定手法、パターン認識の特徴抽出や情報縮約法、クラスタリング、データマイニング Data Miningなどの技法である。これらの技法はとくに生物医学を目標として開発されたものでなく、さまざまな分野に応用されている。それゆえ、多くの技法は、統計やデータ解析、パターン認識の分野でよく知られたパケージ、SAS, S(最近はR)などに組み込まれている。Bio Conductorは、そのRを基礎にオミックスデータ解析のための開発された専用ソフトウエアで、無料で使える上に使い勝手がよく、更新もよく行われていることから、人気が高い。
  • Bio Conductor Project http://www.bioconductor.org/
  • R packages, etc : R. Irizarry http://biosun01.biostat.jhsph.edu/~ririzarr/
  • MAANOVA 2.0 : G. Churchill http://www.jax.org/staff/churchill/labsite/software/anova/index.html
  • GeneTS : K. Strimmer http://www.stat.uni-muenchen.de/~strimmer/software/genets/
  • SMA Statistics for Microarray Analysis/ affy Affymetrix data analysis : B. Bolstad http://www.stat.berkeley.edu/users/bolstad/index.html
  • Statsci.org/macroarray, S-Plus, R-Plus : G. Smyth http://www.statsci.org/smyth/
  • SAM: Significance Analysis of Microarrays : R. Tibshirani http://www-stat.stanford.edu/~tibs/SAM/
  • Smartpred etc: T. Hastie http://www-stat.stanford.edu/~hastie/
  • Microarray/Analysis and Software : D. Allison http://www.soph.uab.edu/ssg_content.asp?id=1290
  • R package, S-Plus, Z-Image, etc. http://www.stat.berkeley.edu/~terry/zarray/Html/soft.html

5.データ解析技法に関するTutorial

   以下は、上記の技法についての入門的な解説サイトや論文の例である。
  • W. S. Noble, Support vector machine application in computational biology, 2003. On-line.
  • T. Mary-Huard et al., Introduction to statistical methods for microarray data analysis, on-line.
  • I. Levner, Proteomic Pattern Recognition, on-line
  • I. Levner, Feature selection and nearest centroid classification for protein mass spectrometry, BMC Bioinformatics, 6(68): 2005.
  • R. Goodacre Metabolomics by numbers:acquiring and understanding global metabolite data, TRENDS in Biotechnology, 22(5): 245-252, 2004
  • M. Brown A metabolome pipeline: from concept to data to knowledge, Metabolomics 1(1): 39-50, 2005

6.専門領域の参照知識

6.1 Gene Ontology  
   解析Analysisにしても解釈Interpretationにしても,必要になるのが、遺伝子やタンパク質、代謝物などの名称、属性、相互関係など、生物医学の基礎的な知識である。とくに参照されるのがGene Ontologyである。
  • PubMed
  • Genome Browser
  • Locus Link
  • Gene Ontology
  • M. Ashburner et al., "Gene Ontology: tool for the unification of biology", Nature Genetics 25, 25 - 29, 2000
6.2 Pathway/Network  
   解析から解釈へというのが最近のオミックスデータに関する流れである。この目的で浮上していきたのが、Pathway/Network Modelである。後者に関しては、すでに別の項で紹介しているように、200を越えるデータベースの存在が知られている。よく参照されるのは、BioCarta、EcoCyc/MetaCyc、KEGGなどであるが、広く既存のデータベースを探すためには、案内データベースであるPathDBを参照するとよい。
6.3 オミックス・データ解析  
   オミックスデータの解析に関しては、最初はSiliconGeneticsなど、商品パケージソフトが知られていたが、最近は無料で利用できる高機能のソフトも出てきた。TIGER MeVやBio Conductorはそうした例である。
6.4 Visualization  
   視覚化Visualization のツールは、多くのデータ解析のソフトウエア・システムに組み込まれている。最近は、OmicsデータをPathway/Network ModelにMappingすることが盛んになってきた。後者に関しては次の項に分類する。

↑TOPへ

7.解析と解釈機能を備えたソフト

   解釈機能に重点を置く解析技法の基礎は、単一の遺伝子発現を比較するのではなく、複数の遺伝子あるいはある遺伝子の組setに注目することである。これらの組としては、遺伝子同士が位置的に近いとか、(Gene Ontologyの分類で)同じBiological functionを担っているとか、同じPathwayにmappingされる、などの知識に基づき選択される。以下はこれらの技法に関するサイトと論文である。
情報提供サイト
  • Onto-Express http://vortex.cs.wayne.edu/ontoexpress/
  • GoMiner http://discover.nci.nih.gov/gominer/
  • DAVID http://apps1.niaid.nih.gov/david/
  • EASEonline http://prtl.uhcl.edu/portal/page?_pageid=417,418658&_dad=portal&_schema=PORTALP
  • GeneMerge http://www.oeb.harvard.edu/hartl/lab/publications/GeneMerge/GeneMerge.html
  • FuncAssociate http://llama.med.harvard.edu/cgi/func/funcassociate
  • GOTM http://genereg.ornl.gov/gotm/
  • FatiGO http://fatigo.bioinfo.cipf.es/
  • CLENCH http://www.personal.psu.edu/faculty/n/h/nhs109/Clench/
  • GOstat http://gostat.wehi.edu.au/
  • GOToolBox http://crfb.univ-mrs.fr/GOToolBox/index.php
  • GoSurfer http://bioinformatics.bioen.uiuc.edu/gosurfer/
  • eGOn http://www.genetools.no/
  • FunSpec http://www.esat.kuleuven.ac.be/~saerts/software/go4g.html
  • ProToGo http://www.protogo
  • goTermFinder http://genome-www4.stanford.edu/cgi-bin/SGD/GO/goTermFinder
  • GenMAPP http://www.genmapp.org/
  • MAPPFinder http://www.genmapp.org/MAPPFinder-specs.html
  • GeneXplorer http://www.gmod.org/?q=node/32
  • BRIGEP-the BRIDGE-based genome-transcriptome-proteome browser https://www.cebitec.uni-bielefeld.de/groups/brf/software/brigep/cgi-bin/bridge.cgi
  • ChipInfo http://www.biostat.harvard.edu/complab/chipinfo/
  • Pathway miner http://www.biorag.org
解説論文
  • P. Khatri, S. Draghici, Ontological analysis of gene expression data: current tools, limitations, and open problems, Bioinformatics, 21(18): 3587-3595, 2005
  • K. D. Dahlquist et al., "GenMAPP, a new tool for viewing and analyzing microarray data on biological pathways", Nature Genetics 31, 19 - 20, 2002
  • S. W. Doniger et al., "MAPPFinder: using Gene Ontology and GenMAPP to create a global gene-expression profile from microarray data", Genome Biology, 4, R7, 200
  • B. R. Zeeberg et al., "GoMiner: a resource for biological interpretation of genomic and proteomic data", Genome Biology, 4, R28, 2003
  • C. A. Rees et al.,"GeneXplorer: an interactive web application for microarray data visualization and analysis", BMC Bioinformatics. 5, 141, 2004
  • A. Goesmann et al.,"BRIGEP-the BRIDGE-based genome-transcriptome-proteome browser", Nucleic Acids Research, 33, W710-W716, 2005
  • S. Zhong, C. Li, & W. H. Wong, (2003), ChipInfo: software for extracting gene annotation and gene ontology information for microarray analysis, Nucleic Acids Res. 31, 3483-3486.
  • S. Draghici, et al, Onto-Tools, the toolkit of the modern biologist: Onto-Express, Onto-Compare, Onto-Design and Onto-Translate Nucleic Acids Res. 31, 3775-3781, 2003
  • P. Khatri et al, Onto-Tools: an ensemble of web-accessible, ontology-based tools for the functional design and interpretation of high-throughput gene expression experiments, Nucleic Acids Research, Vol. 32, Web Server issue W449-W456, 2004.
  • G. F. Berriz, Characterizing gene sets with FuncAssociate, Bioinformatics 19, 2502-2504, 2003
  • S. Zhong et al., GoSurfer: a graphical interactive tool for comparative analysis of large gene sets in Gene Ontology space, Appl Bioinformatics 3, 261-4, 2004
  • A. Subramanian et al., Gene Set Enrichment Analysis: A Knowledge-Based Approach for Inetrpreting Genome-wide Expression Profiles, PNAS, 2005
  • Homin K Lee, ErmineJ: Tool for functional analysis of gene expression data sets, BMC Bioinformatics 6:269, 2005

8.自動的に知識を収集するシステム

  • A. Rzhetsky et al.,"GeneWays: a system for extracting, analyzing, visualizing, and integrating molecular pathway data", Journal of Biomedical Informatics, 33(1), 43-53, 2004

9.Pathway/Network

  • Pathguide http://cbio.mskcc.org/prl/index.php
  • KEGG Metabolic Pathways http://www.genome.jp/kegg/pathway.html
  • BioCarta http://cgap.nci.nih.gov/Pathways/BioCarta_Pathways
  • BioCyc: EcoCyc E..coli Genes and Metabolism http://www.ecocyc.org/
  • BioCyc: HumanCyc Metabolic Pathway Database http://humancyc.org/
  • BioCyc: MetaCyc Metabolic Pathway Database http://metacyc.org/
  • CFG Glycosylation Pathways http://web.mit.edu/glycomics/gt/gtdb.shtml
  • ExPASy: Biochemical Pathways http://www.expasy.org/cgi-bin/search-biochem-index
  • Fukuoka Univ. Biochem. Lab.(Japanese) http://www.sc.fukuoka-u.ac.jp/~bc1/Biochem/index2.htm
  • The Metabolic Pathways of Biochemistry http://www.gwu.edu/~mpb/
  • UM-BBD http://umbbd.ahc.umn.edu/
  • **Protein Lounge Disease Genes Database (www.proteinlounge.com/disease_database.asp)

Ⅲ.Digital Physiology & Pathology

    経路網から疾患を理解し、医薬品開発を考える、という視点からすると、Metabolic Syndromeの研究にはさまざまな経路網が関与している。例えば
  • Bioenergy Production Pathway in Mitochondria
  • Adipokeine Pathway & Adipogenesis
  • Food intake control in CNS
  • Insulin Signaling & Longevity Pathway
  • Bioenergy sensor-processor system
  • Chemical sensor-processor system
  • Epithelium cell model
などに関しては、かなり詳細なPathwayがしらべられている。ただし、これら多くはまだ計算で扱えるような形式には整理されていない。これは焦眉の急と言えるBioinformaticsの課題である。

Ⅳ.Animal Models

    Metabolic Syndrome関連疾患の研究においても、マウスなど哺乳類以外のモデル動物が使われる。もっともよく使われているのは、線虫C. elegansとショウジョウバエDrosophilaである。この2つのモデル動物は、それぞれ詳しい研究支援情報が整備されている。
  • modENCODE (Model Organism ENCyclopedia Of DNA Elements) Project
    http://www.genome.gov/26524507
    Project for identification of all functional elements in selected model oganism geomes.
  • C.elegans
    C.elegans WWW Server  http://elegans.swmed.edu/
    WormBook http://www.wormbook.org/ 
  • Drosophila
    Fly Base http://flybase.org/
    FlyBrain http://flybrain.neurobio.arizona.edu/
例えば、modENCODEは、ENCODE計画の線虫とショウジョウバエ版である。C.elegans WWW Serverは、線虫の研究コミュニティが提供している基盤知識であり、WormBookは、入門知識Tutoorialや、さらに具体的な実験研究に直結した知識が提供されている。ここにある、
  • Ashrafi, K. Obesity and the regulation of fat metabolism (March 9, 2007), WormBook, ed. The C. elegans Research Community, WormBook, doi/10.1895/wormbook.1.130.1, http://www.wormbook.org.
は、線虫を材料としたMetabolic Syndromeの実験的研究の優れた案内になっている。
こうした無脊椎動物に関するより一般的な情報は下記にある。
  • Health Sciences Library System http://www.hsls.pitt.edu/guides/genetics/obrc/genomics/non_vertebrates/invertebrates
関連論文
  • T. Kaletta, M. O. Hengartner, Finding function in novel targets: as a model organism, Nature Reviews Drug Discovery, online, April 2006.
  • N. Perrimon, Drug-target identification in cells: combining high-throughout RNAi and small-molecule screens, Drug Discovery Today, 12(1-2): 28-33, 2007.
  • D. Boffelli, COMPARATIVE GENOMICS AT THE VERTEBRATE EXTREMES, Nature Reviews Genetics 5: 456-465, 2004
  • A. Stathopoulos, M. Levine, Genomic Regulatory Networks and Animal Development, Developmental Cell, 9: 449-462, 2005.
  • E. H. Margulies et al., Identification and Characterization of Multi-Species Conserved Sequences, Genome Research 13:2507-2518, 2003

Ⅴ.その他の情報源

   ライフサイエンスデータベース統合 http://lifesciencedb.jp/MEXT_H18/ 我が国で始まったライフサイエンスの知識を統合する試み。
  • NCI主導のPharmacogenetics/ Pharmacogenomics Knowledge Base(http://www.pharmgkb.org/)
↑TOPへ