素粒子物理学と情報科学を学び、後に医学を修めた異色の経歴。
多様な知識と経験を活かし、画期的なオミクス解析手法を編み出した。
生体内の分子を網羅的に解析する研究は「オミクス」と呼ばれる。対象が遺伝情報(ゲノム)の場合は「ゲノミクス」、タンパク質(プロテイン)なら「プロテオミクス」、代謝物(メタボローム)なら「メタボロミクス」というように、オミクス研究の対象はさまざまだ。いずれも生命現象や病気のメカニズムの解明を目指している。
角田教授は、オミクス解析の強力なツールを開発した。画像処理を得意とする人工知能の技術を駆使した「DeepInsight法」だ。これまでにない高い精度で、オミクスデータを分類することができる。
角田教授の研究対象の一つに「がんの遺伝子」がある。
「がんのタイプを遺伝子データから分類できれば、患者に最適な治療法を選ぶことができます。ところが、がんがとりうる遺伝子パターンは非常に多いうえ、サンプルとなる患者数はとても少ない。そのため、従来の統計学的な解析には限界がありました」
そこで角田教授は、画像などの非線形データを扱う深層学習の技術に着目した。
深層学習は、画像処理で優れた能力を発揮するが、がんの遺伝子データは、画像データそのものではない。遺伝子データを画像データのように扱うことができれば、深層学習をゲノミクス解析に応用できると角田教授は考えたのだ。
「私は数学も好きで、高次元を低次元に圧縮する方法があることを知っていました。遺伝子は変数が多い高次元データですが、画像は典型的な2次元データです。遺伝子データを2次元で表現することができれば、画像データとして取り扱えるはずだとひらめきました」
この、遺伝子データの「画像化」こそが、この研究のポイントだ。そして、2次元化した遺伝子データを、深層学習で人工知能に学ばせる。それにより、高精度なデータ分類が可能となった。既存の人工知能技術の機械学習による分類手法と比べても、はるかに優れた成績を得ることができたのだ。
角田教授いわく、DeepInsight法は普遍化可能な手法だ。
「2次元化可能なデータであれば、オミクスデータはもちろん、あらゆるデータを深層学習にかけることが原理的に可能です。実際、がんの遺伝子データのほかにも、テキストデータや音声データなどでも高精度の分類を行うことができました。今後、さらに深層学習の能力を向上させ、複数のオミクスを組み合わせたより複雑なデータを扱えるようになることを目指しています」
今は生命医科学を研究する角田教授だが、その来歴は幅広い分野に及んでいる。修士課程までは素粒子物理学を研究し、博士課程で情報科学の世界へ。工学博士取得の後、医学の博士号も取得して、医療ビッグデータの解析も手掛けた。教授がDeepInsight法を開発できたのは、この類稀な足跡の賜物といえるだろう。
「結果として、多くの引き出しを持つことができました。分野は違っても、根本に流れるサイエンスは共通しています」
ひとつの興味あることを深めるのも、いくつもの興味あることに挑むのも、研究者としての生き方だ。多様な世界を見なければ、生み出せないものもある。
※2020年理学部パンフレット(2019年取材時)
文/漆原次郎、編集/萱原正嗣、写真/貝塚純一