バイオインフォマティックスでノーベル賞を……
8月から、NTU(南洋理工大学)の大学院でバイオインフォマティックスを勉強することになった。バイオインフォマティックスはコンピュータエンジニアにとって突如現れたサイエンスへの道。もともとサイエンスをやりたかった私は、『これはチャンス』とばかり、その世界に飛び込むことにしたわけだ。
そして、どうせやるなら、目標は高くノーベル賞を目指したいと思っている。入学前で、現実を知らないからこそ書けることだと思うが、そのあたりについての、素人の考察を書いてみる。現実を知った後の将来の自分や、現在その世界で研究に切磋琢磨している人が見ると、多分『何をあほなことを書いているのか!』と笑われるのだろうが、それはそれで、素人の特権だ。笑われるのを覚悟で書いてみる。
私の専門はコンピュータサイエンスだ。それゆえそちらの方の準備は不要としても、生物学は30年も前の高校時代に勉強しただけなので、せめて学部レベルの知識ぐらいは準備しておくべきだと思い、生物学を最近ガンガン勉強している。勉強していくと、次から次へとノーベル賞受賞につながった研究成果の紹介が出てくる。それを読み進めるうちに分かってきたのが、ノーベル賞受賞につながる研究内容の傾向。素人が読み散らして得た知識をもとにした内容で、完璧な整理にはほど遠いものだとは思うが書いてみた。
ノーベル賞につながる研究成果は、世界で行われている同じ分野の研究で、ブレークスルーになるものでなくてはならない。ブレークスルーと言うのは、文字通りの意味で、『世界中の研究現場でぶち当たっている大きな壁を突き崩すもの』という意味だ。それは、今まで説明出来なかった自然現象を説明する画期的な理論だったりすることは当然だが、そのほかに、その分野の実験をするに際しての画期的な方法を編み出したことなども含まれる。
最初の例、つまり画期的な理論を編み出した例は、DNAの構造を解明して、遺伝情報の複製の仕組みの解明への道筋をつけたワトソン、クリック、ウィルキンスの3氏が受賞した1962年のノーベル生理学賞。
2番目の例、つまり画期的な実験方法を編み出した例は、DNAの複製と言うか増幅法で画期的な方法、Polymerase Chain Reaction(PCR)、を編み出したキャリー・マリス氏の1993年のノーベル化学賞。PCRのお陰でほんの少しのDNAサンプルさえあれば、その技術を使って大量に複製、つまり増幅し、塩基対情報を読み取ることが出来るようになった。PCRは研究者にとって『夢のような』技術。
当然ほかにも、多くのノーベル賞があるが、まだ勉強し始めたばかりの生物学の知識では、すべてを挙げるのは到底無理なので、例はこれぐらいにして。
さて、バイオインフォマティックスで上の2パターンのそれぞれで、ノーベル賞級の研究成果となりえる、生物学の未解明の分野を考えてみた。まず、画期的な理論を見つけて、ノーベル賞をとる道。
今では多くの生物種のDNAの全塩基配列の読みとりが完了し、種ごとの塩基配列の比較が可能になってきている。その結果分かってきたことが、全塩基対のう ち、突然変異の発生確率から理論的に予測される種間の配列の違いの頻度よりも、配列の違いの頻度が少ない部分の量が意外に多いことだ。
一般に、生物の生存にとって意味の無い部分に突然変異が起こって塩基対情報が変わったとしても、自然淘汰されず変異の塩基対が残る。それに対して、意味のある部分に発生した突然変異は、大抵の場合は生存に悪い影響を及ぼし、その個体は子孫を残すことなく死に耐える。この事実から推定できることは、現代の時点で読み取ったDNA塩基対で、生物種間での類似性が高い部分は、生物の生存にとって絶対必要な部分だと推定出来るということだ。
そして今までの研究で、確かに、たんぱく質に変換される部分、つまり遺伝子の部分や、遺伝子の発現を制御する部分は、その理屈通り、生物間での塩基対の違いは少ない。しかし、興味深いのは、違いが少ない部分が、遺伝子や遺伝子の制御部分以外にも大量に見つかったということだ。その部分は明らかに、何か生物の生存にとって重要な機能を持っているのだが、それが何なのか今のところ分かっていない。もし、その未知の機能をバイオインフォマティクスを駆使した研究で明らかに出来れば、たぶんそれはノーベル賞級の研究成果だろう。
ワトソンとクリックは、有機化学の分子構造の理論、エルヴィン・シャーガフ氏が発見した、DNAの4種類ある塩基でTとAそして、CとGが対になっていると言う事実。そして、ロザリンド・フランクリン氏による、DNAのX線結晶解析法など、他の研究機関の研究成果をもとに、分子模型をレゴブロックのごとく組み合わせて、DNAの構造を解明したわけだ。
それと同じように、現在、世界中で行われている研究の成果をもとに、コンピュータ上でバイオインフォマティックスを駆使して、そのDNA上にあると推定される未知の機能は解明出来ないだろうか?
2番目の、画期的な研究のためのツールを編み出してノーベル賞を取得する道についても考えてみよう。現在、たんぱく質のアミノ酸配列はたんぱく質から直接読み取ったり、目的のたんぱく質にトランスレートされるDNA塩基対の情報から、比較的に簡単に解明できる。しかし、たんぱく質の機能は、アミノ酸配列から一意に決まる立体構造で決まる。そして、その立体構造をアミノ酸の塩基配列からコンピュータの計算で求める方法は、まだ部分的にしか成功していない。
現在のところは、立体構造はX線結晶構造解析や核磁気共鳴分光法などで実際の立体構造から求められているに過ぎない。コンピュータの計算で、立体構造を求めるには膨大な計算量が必要とされ、スーパーコンピュータの活躍が期待される分野だ。最近神戸に完成したという、世界最速のスーパーコンピュータ『京』が、この分野にかなり貢献するだろう。しかし、もし普通のデスクトップレベルのコンピュータで、たんぱく質の立体構造を計算出来るようなアルゴリズムを編み出すことが出来れば、たぶんそれはノーベル賞だろう。
そんなこんなで、もうすぐ50歳になろうというロートルが戯言を並べているのでした。