東京大学医科学研究所 ヒトゲノム解析センター

ゲノムデータベース分野 金久研究室

HOME Member Research Education Access Japanese / English

研究テーマ

ヒトゲノム解読終了後もシークエンシングその他のハイスループット実験技術の進歩により、トランスクリプトーム、プロテオーム、メタボローム、グライコーム、ケミカルゲノム、メタゲノムなど広い意味でのゲノム関連情報が蓄積されている。本研究室ではこれらを統合して生体システムの機能を解釈し、創薬や医療につなぐバイオインフォマティクス研究と、KEGGデータベースの一部として関連リソースを開発する任務を担っている。

1. 疾患と医薬品のデータベース

KEGGは、ゲノム情報、ケミカル情報、高次機能情報を統合した、生命システム情報統合データベースである。ゲノムや分子の情報から細胞・個体といった生命システムの機能と有用性を理解するためのレファレンス知識ベースとして、広く利用されている。KEGGの基本的なコンポーネントは、京都大学で開発されているが、本研究室は、KEGGの応用的な領域、特に、医学や薬学といった領域を担当しており、KEGG DRUG および、KEGG DISEASE を開発してきた。 KEGG DRUGは、全ての承認薬の化学構造データベースであり、KEGGパスウェイの中にはターゲット情報が、また、階層型薬物分類として効能情報が関連づけられている。KEGG DISEASEは、KEGGに新しく追加されたデータベースである。各データベースエントリーは、疾患の遺伝子のリスト、および、環境因子、マーカー、薬などの分子のリストから構成されている。DRUGとDESEASEはともに、PATHWAY、BRITE、GENES、COMPOUNDなどのKEGGに含まれるデータベースや、その他のインターネット上のリソースと、高度に統合されている。

2. KEGGシステムのSOAP/WSDLインターフェース

本研究室は、KEGG API の開発も担当している。KEGG APIは、SOAP/WSDLを用いたWebサービスであり、KEGGを利用するのに有用な、様々なAPIを提供している。KEGG APIは、SOAPを扱えるあらゆるプログラミング言語から利用可能であり、ユーザは、KEGG APIを用いることで、KEGGを自動的に利用するような独自のプログラムを開発することができる。

3. ESTコンセンサスコンティグの自動生成

多くの植物のように、未だゲノム配列が利用できない生物種においては、EST配列を決めることは、経済的な観点から現実的な遺伝子発見手法であると考えられている。様々な大規模EST計画が進行中であり、ESTを統一的に容易に扱うことができる、バイオインフォマティクスのツールが必要とされてきた。つまり、ある生物のトランスクリプトームを明らかにするために、大規模なEST配列の情報処理と、機能アノテーションを行うための汎用ツールの重要性が再認識されている。そのために本研究室では、EST配列やゲノム断片に対して、配列のクリーニング、リピートのマスク、ベクター配列の除去、オルガネラ配列のマスク、クラスタリングおよびアセンブルといった一連の処理を自動的に行うツール、EGassembler を開発している。KEGG EGENESは、EGassemblerを用いて開発されている。

4. 完全ゲノムにおけるオーソログおよびパラログの自動的な同定

我々は、適切なオーソログ遺伝子クラスターを自動的に発見する計算機手法を開発してきた。KEGG SSDBには、全ての完全ゲノム配列に含まれる遺伝子間の類似性スコアと、ベストヒットの関係がデータベース化されており、この手法は、SSDBの遺伝子間の関係をグラフ構造と見なすことで、グラフ解析に基づいて遺伝子クラスターを発見する。巨大なグラフオブジェクトの複雑性を軽減するために、生物の進化的な関係を反映した階層情報を導入して、SSDBを入れ子状のグラフとして扱うようにしている。

5. コミュニティゲノムアノテーションの網羅的なレポジトリ

KEGG DAS は、KEGGに含まれる全生物のゲノムマップ情報に対して、DAS(Distributed Annotation System)サービスを提供する高度ゲノムデータベースシステムである。BioRuby、BioPerl、BioDAS、GMOD/GBrowseなどのオープンソースソフトウェアを利用することにより、システムを既存のオープンスタンダードに準拠させている。KEGG DASデータベースは、GBrowse GUIを用いて、ウェブブラウザからグラフィカルに利用でき、また、DASプロトコルを用いて、プログラムからも利用できる。

論文リスト(東大・京大)

東京大学産学連携プロポーザル

 
Human Genome Center University of Tokyo