科学技術振興事業機構バイオインフォマティクス推進事業

ゲノムと環境の統合解析による生命システムの機能解読


代表研究者

 金久 實(京都大学化学研究所バイオインフォマティクスセンター東京大学医科学研究所ヒトゲノム解析センター

基本構想

 DNA、RNA、タンパク質は生命を構成する基本分子である。しかし細胞はこれだけの分子から構成されているわけではない。水、イオン、様々な低分子化合物、さらには糖鎖、脂質などの生体高分子も存在する。生体内物質の合成・分解・輸送に関与するのはタンパク質であるので、これらもゲノムが間接的に規定しているとみなすこともできるだろう。ヒトゲノム解読に続くポストゲノム研究においては、広い意味でのゲノム情報、すなわちゲノムの配列だけでなくその多様性(SNPなど)や、トランスクリプトーム(RNA)、プロテオーム(タンパク質)、メタボローム(代謝化合物)、グライコーム(糖鎖)、リピドーム(脂質)といった様々な生体内物質の系統解析がなされてきた。高等生物から微生物までゲノム解読がルーチン化され、地球上の生命がもつゲノム情報のレパートリー(これをゲノム空間と呼ぶことにする)がしだいに明らかになりつつあると言えるだろう。
 一方、生命は自然界の一部として存在し、地球環境の進化とともに進化してきた。生物界のまわりにある自然界は生命にとっての環境であるが、そこに存在する化学物質のレパートリー(これをケミカル空間と呼ぶことにする)については、まだ全体像がまったく見えない状況にある。ケミカル空間にはイメージングプローブや創薬リードなど有用な化合物が潜んでいると考えられ、従来のオミクス研究の延長として、実用的な観点からそのスクリーニングを行っているのが、米国のケミカルゲノミクス研究である。ケミカル空間にある創薬リードと、ゲノム空間にある創薬ターゲットのつながりは、より一般的に生命システムにゆらぎを与える物質とそのターゲット分子のつながりである。ケミカルゲノミクスがもたらす大量データは、生体外と生体内の分子的なつながりを表しているわけで、生命システムと環境との相互作用を理解する基本データとなる。
 ヒトゲノム解読は医学研究に大きな進展をもたらした。とくに1つの遺伝子の突然変異が引き起こす単一遺伝子疾患の原因遺伝子が多数明らかにされた。一方では、臨床的に数が少ないこれら遺伝性疾患に対して、日常的な病気は様々な遺伝因子と様々な環境因子が複雑に絡み合った多因子性疾患である。ヒトの健康や病気は、生体システムが安定した状態にあるかゆらいだ状態にあるか、システム的な観点でとらえるべきであり、ゲノムのゆらぎ(遺伝因子)とケミカルなゆらぎ(環境因子、及び薬物)を分子レベルで統合して理解していく必要がある。
 本研究では、ゲノム空間とケミカル空間に関する大量データをバイオインフォマティクスで統合し、生命システムの構築原理を理解すると同時に、そこから得られる知識を医療、創薬、環境保全に役立てることを目的として、すでに生命システム情報の国際的な基盤データベースとなっているKEGGを飛躍的に発展させる。これまで生体内分子に限られていたKEGG PATHWAYの配線図に生体外分子とのつながりを含めることにより、ゲノム空間とケミカル空間との関連、及び生命システムと環境との相互作用に関する基盤情報を提供する。また、細胞・組織・器官・病気・薬効といった様々な高次の知識をKEGG BRITEの機能階層に取り入れ、ゲノムの機能解読と有効利用を促進する。さらにKEGGの日本語化も行って、わが国の知的財産権と国際競争力に貢献する。

研究開発の内容

 KEGGは、生命システムを構成する部品の情報として遺伝子・タンパク質に関するゲノム情報(GENES)と代謝化合物・糖鎖・脂質などに関するケミカル情報(LIGAND)を、また部品間の配線図情報として相互作用・反応に関するパスウェイ・ネットワーク情報(PATHWAY)を統合し、さらにゲノムから高次生命システム機能解読のためのオントロジー(BRITE)を加えた、生命システム情報統合データベースである。本研究開発ではKEGGを以下のように発展させる。

(1) KEGGデータベースの開発
(1-1) 薬物・環境物質など生体外物質に関する知識の集約
 これまで、主に生体内物質に関する情報を蓄積してきたLIGANDデータベースに、薬物や環境物質など生体外物質の情報を追加する。化合物の化学構造とともに、生体システムとの相互作用や生体内での代謝経路との関連を含めてデータベース化する。薬物については、開発の歴史などをグラフィカルな構造マップとして要約し、基本骨格や化学構造変化をパターン化して、ターゲットとの関連や薬効との関連が明らかになるようなデータベースとする。環境物質については、ケミカル空間とゲノム空間の関連を、生体内化学反応とそれを触媒する酵素の関連として体系化し、微生物による環境物質の分解経路予測といった方法論を確立する。

(1-2) 病気など高次生命システム機能に関する知識の集約
 KEGGの中核となるPATHWAYデータベースとBRITEデータベースの高度化・標準化を行う。PATHWAYデータベースは細胞・個体の機能に関与する分子間相互作用・反応ネットワークの知識を論文等から手作業で集約しグラフィカルに表現したパスウェイマップの集合である。今後は免疫系・神経系等の高次生命機能や病気に関連したパスウェイを充実させる。BRITEデータベースはより幅広く、生命システムとその環境に関する様々な知識を階層的な語彙で表現した階層テキストファイルの集合である。今後は人体や病気といった高次レベルの分類体系を充実させ、遺伝子の分類体系であるKOを通してGENESデータベースと関連づけを行い、ゲノムから高次生命システムの機能解読を自動的に行う方法論を確立する。

(2) KEGG利用環境の開発
(2-1) 個別目的のためのビュー開発
 KEGGは幅広い基礎研究及び応用研究を支える基盤データベースであり、今後ともGENES、LIGAND、PATHWAY、BRITEを4つの柱とし、Webサーバー、SOAPサーバー、FTPサーバーの形態で提供する。一方、KEGGは内容的に複雑であるため(生命システムの複雑さを反映しているからなのだが)使い方が分からないとの声も多く、個別目的に利用しやすいようなビュー(データベースの見方)を提供する。とくに本研究で新たに薬物、環境物質、病気の遺伝要因と環境要因といったデータを蓄積していくことになるので、医療、創薬、環境保全への応用にカスタマイズしたビューとして、KEGG DISEASE、KEGG DRUG、KEGG ENVIRONMENTを開発する。また国内の利用を促進するため、日本語化されたインターフェースも開発する。

(2-2) パーソナライズド環境の開発
 本研究開発では、世界中の主要データベースが未だ試みていない新しい利用形態を提供する。それはパソコン等で動くアプリケーションを開発し、KEGGがもつデータベース構築のノウハウを普及させて、個人あるいは組織等がローカルにもっているデータや知識を統合して利用できる環境、すなわちパーソナライズドされたKEGGを提供することである。幅広いニーズに応えるため、KegHierなどのアプリケーションでパソコン上の個人ファイルと統合して利用する小規模な環境から、KEGGのミラーであるiKegサーバーを導入した大規模な環境まで、様々なレベルをサポートする。

研究開発の実施体制

 研究開発チームは代表研究者(金久 實)の下に2つの研究開発グループ(KEGG生命・環境グループおよびKEGG創薬・医療グループ)をもって構成する。KEGG生命・環境グループの研究開発は京都大学化学研究バイオインフォマティクスセンター(京都大学宇治構内)において実施する。KEGG創薬・医療グループの研究開発は東京大学医科学研究所ヒトゲノム解析センター(東京都港区白金台)において実施する。


Created on August 3, 2006

[ バイオインフォマティクスプロジェクト ]