search
search

Press Releases

DATE2025.07.04 #Press Releases

微生物-代謝物関連性発見のための深層ベイズ統合解析法VBayesMMを開発

発表のポイント

  • 微生物-宿主(ヒト)代謝物間の関連性の発見のため、深層学習とベイズ推論を統合した新しい解析手法(VBayesMM)を提案しました。
  • VBayesMMは、従来の深層学習では不可能だった予測不確実性の定量化を実現しました。その性能は既存手法を大幅に上回り、生物学的解釈可能性を向上させつつ実行時間も改善しました。
  • 本手法を用いたヒトマイクロバイオーム研究により、ヒトの病気と微生物との新たな関連性とその背景にあるメカニズムの発見や、診断・治療法の新たな開発が期待されます。


微生物-宿主代謝物間の関連性を発見するためのVBayesMM法


発表概要

東京大学大学院理学系研究科のトウンダン特任研究員、アルテムルイセンコ准教授、角田達彦教授(兼 同大学新領域創成科学研究科教授)らは、変分ベイズマイクロバイオーム(注1) ・マルチオミクス(注2) (VBayesMM)という新しい手法を開発しました。本手法により、ヒトの体内や体表のマイクロバイオームのデータから、その箇所でのヒトの代謝物量を高精度に予測し、健康な場合や病気の場合での微生物-宿主(ヒト)代謝物間の複雑な相互作用メカニズムを解明することが可能になります。これにより例えば、従来困難であった腸内細菌叢の生化学的機能の理解が飛躍的に進みます。

今回開発したVBayesMMでは、マルチオミクスのデータの高次元性に由来する推論の不確実性の問題に対して、ベイズニューラルネットワーク(BNN)(注3) にスパイク・アンド・スラブ事前分布(注4) を組み込むことで解決しています。さらに、変分推論(注5) を用いて計算量を減らすことで、大規模マルチオミクスデータを高速に解析することができるようになりました。これらにより、重要な微生物種をより迅速かつ精密に特定でき、さらに微生物とヒト代謝物が同時に存在する確率をより正確に推定することができるようになりました(図1)。 この手法を用いることにより、健康な場合と病気の場合それぞれでのマイクロバイオームと宿主(ヒト)の代謝物の間の動的な相互作用を包括的に解明し、個別化医療の推進や治療標的の発見、病気の予防などの医学応用に貢献することが期待されます。


図1 :VBayesMM手法の概要。

微生物データ → 潜在空間解析 → 宿主の代謝物量の予測を行うためのエンコーダ・デコーダ型ベイズニューラルネットワークの構造。スパイク・アンド・スラブによる特徴選択機能が重要なポイントの一つ。

発表内容

マイクロバイオームがヒトなどの宿主の代謝に与える影響を解明することは、マイクロバイオームの生物学的機能や、宿主との相互作用の形成過程を理解する上で重要な役割を果たします。しかし、その重要性にも関わらず、これまでの解析手法では、マイクロバイオームのデータから宿主の代謝物量そのものやそれに与える影響を予測したり、マイクロバイオーム中で相互作用に関わる重要な細菌種を特定したりすることは困難でした。その原因として、マイクロバイオームのデータ(メタゲノムデータ注6 )が超高次元であるため、関係性の推論や、特に各微生物と宿主での代謝物とが同時に存在する確率(共起確率)を推定することが難しいという問題がありました。

この問題を解決するために、私たちは変分ベイズマイクロバイオーム・マルチオミクス(VBayesMM)という新しい手法を開発しました。本手法は次にあげる3つの大きな特徴を持ちます。第一に、独自のスパイク・アンド・スラブ事前分布を用いることで、微生物データに基づいてヒトなどの宿主の代謝物量を予測する精度が飛躍的に向上します。これにより、微生物-代謝物間の複雑な共起(同時存在)パターンが高精度で解明できるようになり、病気に関わる重要な微生物種を自動的に特定できるようになりました。第二に、変分ベイズニューラルネットワークを用いることで、従来の手法では不可能だったデータの不確実性の定量的把握が可能になり、それにより予測不確実性の推定を高い信頼性で行うことが可能になりました。第三に、変分推論を組み入れることで計算時間が劇的に短くなり、実用的な大規模解析が可能になりました。

私たちは、VBayesMMの性能を検証するため、医学的に重要な閉塞性睡眠時無呼吸症候群(特に間欠的低酸素・高呼吸症例、IHH)、高脂肪食(HFD)、胃がん(GC)、大腸がん(CRC)の4つの疾患関連のデータセットを用いて大規模な検証実験を行いました。すると、全てのデータセットで、VBayesMMは従来の解析手法(MiMeNet、MMvec、sPLS)を大幅に上回る予測精度を達成し、VBayesMMの圧倒的優位性が実証できました(図2)。特にスパイク・アンド・スラブ機構により、病気や健康と無関係な微生物種を排除しつつ重要な微生物種を余すことなく特定でき、従来は困難であった生物学的意義のある微生物の選択を自動化することができました(図3)。さらに、多様な病態での微生物-ヒト代謝物の関連性を包括的に解明できました(図4)。

図2:提案手法(VBayesMM、赤色の棒)と従来の3種類の手法との比較。
縦軸は予測結果と実際のデータとの間の誤差を表し、小さい値の方が、性能が良いことを示す。


図3:閉塞性睡眠時無呼吸症候群(特に間欠的低酸素・高呼吸症例、IHH)に関わるものとして、VBayesMMによって選ばれた微生物種を系統樹にマップしたもの。aは疾患グループ、bは健康な人のグループにそれぞれ特徴的な生物種。


図4:VBayesMMを用いて閉塞性睡眠時無呼吸症候群で選択した微生物種とヒト代謝物量の共起確率を2次元で示したもの。aは疾患グループ、bは健康な人のグループでのもの。

本研究で提案したVBayesMM法により、以下のさまざまな側面で波及効果が期待できます。

まず理学的側面として、従来の手法では解析が困難であった微生物-宿主相互作用の分子機構が解明でき、マイクロバイオームの動態予測モデルを構築することや、マイクロバイオームがヒトの代謝ネットワークに与える影響を高精度に推定することが可能になると考えられ、ひいては、微生物生態学の新たな理論構築が可能となると期待されます。

また医学的側面では、VBayesMMにより、例えば腸内細菌叢などのマイクロバイオームと病気の発症の直接的な因果関係を定量的に解明したり、病気に特異的な微生物の組成(シグネチャ)を発見したりすることを通して、個別化医療の診断マーカーの開発や創薬としての微生物標的治療戦略の策定の加速が期待できます。特に、がん免疫、代謝疾患、神経疾患での腸-脳-免疫軸の分子メカニズム解明のために利用することで、次世代医療の基盤確立に貢献することが期待されます。その先の未来として、患者ごとの微生物プロファイルに基づく疾患リスクの層別化、プロバイオティクス療法の個人ごとの設計、患者ごとの薬物応答予測システムの開発により、個別化医療の実用化と治療成績向上に貢献することが期待されます。

計算生命科学という観点では、VBayesMMは計算量が少ないため超高次元で多様なビッグデータに適用可能であり、結果が解釈可能であることから、さまざまなマイクロバイオームデータセットを統合しマルチオミクス解析を実施することで、複雑な生物システムを解明するために役立つツールとなると期待されます。

以上のように、本研究で開発したVBayesMMによって、マイクロバイオーム・マルチオミクス分野のパラダイムシフトが起こり、生物学・医学研究に進歩をもたらすと考えられます。

研究グループ構成員等情報

東京大学大学院理学系研究科 生物科学専攻
 トウン ダン(Tung Dang) 特任研究員
 アルテム ルイセンコ(Artem Lysenko) 准教授
 角田 達彦 教授
  兼:東京大学大学院新領域創成科学研究科 教授

関連情報

東京大学大学院新領域創成科学研究科

論文情報

雑誌名 Briefings in Bioinformatics
論文タイトル
VBayesMM: Variational Bayesian neural network to prioritize important relationships of high-dimensional microbiome multiomics data
著者 Tung Dang, Artem Lysenko∗, Keith A. Boroevich, Tatsuhiko Tsunoda*
(*責任著者)
DOI番号 10.1093/bib/bbaf300

研究助成

本研究は、JSPS科研費「画像変換と深層学習によるマルチオミクス統合解析と病態や薬剤応答機序の解明の方法論(課題番号:JP20H03240)」, JSPS科研費「From data to discovery in cancer immunology: AI-driven spatial transcriptomic(課題番号:JP24K15175)」, JST CREST「生体環境からのAI駆動型1分子ナノポア計測法の開発(課題番号:JPMJCR2231)」の支援を受けて行われました。

用語解説

注1  マイクロバイオーム
ヒトの体内や体表などで生息する微生物(細菌など)の集まり(叢)。特に腸内には約100兆個の微生物が存在し、消化や免疫機能を助けている。このバランスが崩れると、肥満や糖尿病、がんなどのさまざまな病気につながることが分かっている。

注2  マルチオミクス
生体内で起こっているさまざまな現象や病気を調べるために、分子の複数のレベルの網羅的情報を同時に観察実験したもの。例えば、遺伝子の情報、マイクロバイオームに含まれる微生物の種類や配列・量、代謝物の量などを一度に測定・解析することで、病気の原因や治療法をより正確に理解することができる。

注3  ベイズニューラルネットワーク(BNN)
人間の脳の仕組みを真似した人工知能(AI、ここでは特にニューラルネットワーク)に、ベイズ推論と呼ばれる「不確実性」を考慮する機能を加えたもの。通常のAIは「答えはAです」と断定的に予測するが、ベイズニューラルネットワークは「答えがAの可能性は80%、Bの可能性は20%です」のように、予測の確信度も併せて出力する。

注4  スパイク・アンド・スラブ事前分布
大量のデータの中から真に重要な要素だけを自動的に選び出す統計的手法のひとつ。「スパイク」の部分は不要な情報を0に近づけて除外する仕組み、「スラブ」は重要な情報を保持する仕組みを指す。

注5  変分推論
ベイズ推論での計算が困難な事後分布(データを得ることによって更新されたパラメータ値の確率分布)を、より単純な分布で近似する手法。具体的には、事後分布に近い単純な分布を仮定し、その近似の精度を表す指標を最大化することで、元の複雑な問題を扱いやすくする。

注6  メタゲノム
腸内や土壌などの環境中に存在する全ての微生物の遺伝子情報の総称。それを解析することをメタゲノム解析という。従来は一種類ずつ微生物を培養して調べていたが、メタゲノム解析では、その場所にいる何千種類もの微生物の遺伝子を一度に読み取ることができる。