プロテオミクスとメタボロミクスのための解析技術の開発と応用
氏名 近山 英輔
学位の種類 博士(工学)
学位記番号 博乙第285号
学位授与の日付 平成22年6月16日
学位論文題目 プロテオミクスとメタボロミクスのための解析技術の開発と応用
論文審査委員
主査 准教授 城所 俊一
副査 教授 福田 雅夫
副査 准教授 木村 悟隆
副査 准教授 高原 美規
副査 教授 山口 隆司
副査 名誉教授 曽田 邦嗣
[平成22(2010)年度博士論文題名一覧] [博士論文題名一覧]に戻る.
目次
第1章 プロテオミクスとメタボロミクス p.8
1.1 緒言 p.9
1.2 プロテオミクスとメタボロミクス p.11
第2章 プロテオミクスのための解析技術の開発.1 p.17
2.1 概要と目的 p.18
2.2 背景と予備知識 p.19
2.2.1 様々な可溶タンパク質ドメインの大量取得 p.19
2.2.2 集合と確率 p.20
2.3 結果と考察 p.22
2.3.1 可溶タンパク質ドメインの大量取得の数学モデル p.22
2.3.2 可溶タンパク質ドメインの大量取得実験 p.27
2.4 結論 p.34
2.5 研究方法の補足説明 p.35
第3章 プロテオミクスのための解析技術.2 p.36
3.1 概要と目的 p.37
3.2 背景と予備知識 p.38
3.2.1 タンパク質の配列解析 p.38
3.2.2 ソフトウエア開発の技術 p.39
3.3 大量配列解析システムProteoMixの開発 p.43
3.3.1 大量配列解析システムProteoMix p.43
3.3.2 CORBAを用いた分散計算サーバー p.55
3.3.3 SOAPを用いた分散計算サーバー p.60
3.4 考察 p.63
3.5 結論 p.64
3.6 研究方法の補足説明補足説明 p.65
第4章 構造プロテオミクスの研究例 p.66
4.1 概要と目的 p.67
4.2 NMRによる構造プロテオミクス研究の背景 p.67
4.3 方法 p.69
4.4 NMRによるタンパク質の立体構造決定 p.71
4.5 結論 p.78
第5章 メタボロミクス解析技術の開発.1 p.79
5.1 概要と目的 p.80
5.2 背景と予備知識 p.81
5.2.1 核磁気共鳴(NMR)法 p.81
5.2.2 NMRメタボロミクス p.96
5.3 新規NMRメタボロミクス方法論の開発と考察 p.98
5.3.1 異種核多次元NMRメタボロミクス法 p.98
5.3.2 p-value法 p.100
5.3.3 SpinAssignの開発 p.105
5.3.4 SpinAssignを利用した解析手順マニュアル p.147
5.4 結論 p.152
5.5 研究方法の補足説明 p.153
第6章 メタボロミクス解析技術の開発.2 p.157
6.1 概要と目的 p.158
6.2 背景と予備知識 p.159
6.2.1 多変量解析 p.159
6.2.2 代謝プロファイリングと代謝経路データベース p.166
6.2.3 計測対象の生物種 p.167
6.3 新規NMRメタボロミクス方法論の応用と考察 p.171
6.3.1 腸内細菌Butyrivibrio(in vivo) p.171
6.3.2 原生生物Chlamydomonas(in vivo) p.175
6.3.3 陸上植物Arabidopsis培養細胞 T87(in vivo) p.177
6.3.4 陸上植物Arabidopsisアルビノ変異体(抽出物) p.181
6.3.5 昆虫Bombyx(体液) p.186
6.3.6 陸上植物Arabidopsis培養細胞 T87(抽出物、p-value法) p.203
6.4 結論 p.212
6.5 材料と方法 p.213
6.5.1 Butyrivibrio(in vivo) p.213
6.5.2 Chlamydomonas/Arabidopsis T87(in vivo) p.214
6.5.3 Arabidopsisアルビノ変異体(抽出物) p.215
6.5.4 昆虫Bombyx(体液) p.215
6.5.5 Arabidopsis T87(抽出物、p-value法) p.219
要約と今後の展望 p.220
謝辞 p.221
付録 p.222
References p.281
オーム(ome)という言葉は「全て」を意味するギリシア語に由来する。分子生物学実験技術の発展により個々の遺伝子やタンパク質などを決定する方法論が確立されると,次にその方法論は遺伝子やタンパク質の集合の大量解析技術へと発展してきた。1920年にハンブルグ大学の植物学教授Winklerにより,遺伝子(gene)と染色体(chromosome)という言葉からゲノム(genome)という言葉が造られ,今ではオミックス(omics)の概念はトランスクリプトミクス(transcriptomics),プロテオミクス(proteomics),メタボロミクス(metabolomics)と生体分子を網羅的に解析する科学へと広まっていった。本論文は,このようなオミックス解析技術の発展の中で申請者が開発したプロテオミクスを支援するための解析技術とメタボロミクス解析技術について述べたものである。
第1章では,プロテオミクスとメタボロミクスについて述べた。
第2章では,多種タンパク質ドメインの大規模発現実験において,得られる可溶タンパク質ドメインの種類を最大化させるための数学モデルを提案した。プロテオミクス研究に有用なこのモデルは,配列断片の境界の決定を次の2段階の過程で実現する:(1)ドメイン領域を決定する。但し,境界位置にある誤差範囲(数十残基程度を想定するとよい)を持たせておく,(2)正確な境界位置を決定する。申請者のモデルは,条件付き確率を用いてこの過程を定式化した。その結果,このモデルにより,1ドメイン当たりに生成する配列断片数を最適化すれば,最も効率的に可溶ドメインを得ることができることが分かった。そしてその最適解は,1ドメイン当たり1配列断片から7配列断片の生成であることを示した。
第3章では,プロテオミクスに有用な,大量のタンパク質配列と配列解析アルゴリズムを共通インターフェースで利用するメタ解析を目指した,統合配列解析システムProteoMixの開発について述べた。このシステムは申請者が開発責任者として3~4名が常時在籍する開発チームで行ったもので,申請者が中心となり設計/実装を行い,Javaで構築した。ProteoMixは大量のタンパク質配列に対して,様々な配列解析ツールが適用できるように設計されており,同時に複数のタンパク質配列を,複数の配列解析ツールで解析でき,その結果をマージし,視覚化できる。ProteoMixは,CORBAとSOAPを用いたリモートの分散計算サーバーと接続し,計算負荷を分散させることができる。
第4章では,申請者がNMRスペクトル解析によって決定した,ヒト/シロイヌナズナ由来の7つのタンパク質ドメインの立体構造解析について述べた。具体的には,申請者は,1つのタンパク質につき10種以上の2次元/3次元NMRスペクトルを解析し,タンパク質原子への化学シフトの帰属を行い,NOE情報から得られる距離情報を用いて立体構造を算出した。 第5章では,申請者の開発した,世界最高度の候補代謝物アノテーション能力を誇るNMRメタボロミクス解析プラットフォームについて述べた。このプラットフォームは,代謝物化学シフトデータベースを実装した,代謝物の大量アノテーションシステムSpinAssignとp-value法を用いる点が独創的である。13C標識した生物試料のNMRスペクトル中には数百個の未知ピークが出現する一方,データベースには1,000以上のピークが登録されていることから,この未知ピークと代謝物化学シフトデータベースを自動比較できるソフトウエアの開発が求められた。SpinAssignはその要求に応えたものである。そして,自動比較の結果,候補がオーバーラップする部分に対し,候補の信頼性を統計数学的に定量化するカイ二乗分布を用いたp-value法を申請者は定式化し,その結果としてNMRメタボロミクス分野では世界最高度の,候補代謝物アノテーションを達成する方法を開発することができた。このシステムは,様々な生物試料における代謝物の大量解析を可能にし,医学,薬理学,分子生物学,環境学的問題を含む広範な領域の研究ツールとして利用できると期待される。
第6章では,NMRメタボロミクス解析プラットフォームを,実際の様々な生細胞系に適用し,その有用性を示した。まず腸内細菌Butyrivibrio fibrisolvens,単細胞緑色藻類のクラミドモナスへのin vivo NMRを用いたメタボローム解析法の適用の結果,in vivo NMRによるシロイヌナズナ培養細胞の代謝動態解析,シロイヌナズナ植物体アルビノ変異体でのメタボローム解析について述べ,次にカイコ幼虫の生育時における代謝動態の変動解析と,新規開発した代謝マップの全体的な変動パターンを視覚化する方法論について述べた。最後にp-value法を適用して,シロイヌナズナ培養細胞抽出物で世界最高レベルの候補代謝物アノテーションを達成した結果を示した。
本論文は、「プロテオミクスとメタボロミクスのための解析技術の開発と応用」と題し、生命現象の全体像を分子レベルで解明する学問分野であるプロテオミクスとメタボロミクスにおいて、申請者が開発した様々な解析技術とそれらを用いて得られた研究成果とをまとめたものであり、6章から構成されている。
第1章「プロテオミクスとメタボロミクス」では、ゲノム科学からオミックス科学へと発展してきたこの分野の研究の歴史や概要について述べるとともに、プロテオミクスとメタボロミクスにおける本研究の意義について論じている。
第2章「プロテオミクスのための解析技術の開発.1」では、塩基配列情報に基づいて、多種の可溶タンパク質ドメインを高効率で得る実験設計方法を、独自の数学モデルを用いて提案している。さらに、ヒトゲノム配列から蛋白質の24個のドメインを発現し、その可溶性を調べることで、このモデルのパラメタを決定し、1ドメイン当たりに生成させる最適な断片の数を評価している。
第3章「プロテオミクスのための解析技術の開発.2」では、プロテオミクスのツールとして申請者が開発した統合配列解析システムProteoMixについて述べている。このシステムを用いて、複数の蛋白質配列を、インターネット上に存在する複数の配列解析ツールで同時に解析し、その結果を可視化することに成功している。
第4章「構造プロテオミクスの研究例」では、多次元NMRスペクトル解析によって、ヒトやシロイヌナズナ由来の7つの蛋白質のドメインを解析し、溶液中での立体構造を決定することに成功している。
第5章「メタボロミクス解析技術の開発.1」では、細胞抽出物に由来するNMRの大量の化学シフトデータを、既知の代謝物化学シフトデータベースと自動比較し、未知物質に対して候補代謝物を割り当てる解析システムSpinAsignについて述べるとともに、複数の候補代謝物割り当ての信頼性を統計的に比較・定量化するp-value法を提案している。
第6章「メタボロミクス解析技術の開発.2」では、前章までに開発した解析技術を、腸内細菌、単細胞緑色藻類のメタボローム解析、シロイヌナズナ培養細胞の代謝動態解析などに適用した結果について述べている。シロイヌナズナ培養細胞抽出物では、世界最高レベルの候補代謝物アノテーションに成功するなど、申請者の解析技術の有用性が明らかにされている。
このように、本論文では、プロテオミクスやメタボロミクス分野における新規な解析技術を提案するとともに、様々な対象に応用することで、それらの技術の有用性についても明確に示している。よって、本論文は、工学上および工業上貢献するところが大きく、博士(工学)の学位論文として十分な価値を有するものと認める。