機械学習で紐解くエピゲノムの書込み様式
大矢 恵代(生物科学専攻 博士課程(研究当時))
角谷 徹仁(生物科学専攻 教授)
稲垣 宗一(生物科学専攻 准教授)
あらゆる生物の設計図であるゲノムはDNAの4種類の塩基の並び順で記述されている。ゲノムは,その生物を構成するすべてのタンパク質の構造を網羅した辞書のようなものだ。多くの生物において,DNAの4塩基で書かれた辞書には,付箋や蛍光マーカーのような,エピゲノムと呼ばれる情報が付加されている。エピゲノムの分子的実体はDNA自体のメチル化や,DNAと結合しているタンパク質のメチル化,アセチル化等の多様な化学修飾である。ゲノムは長大で,必ずしも必要な情報ばかりではないので,必要な部分や不必要な部分にエピゲノムの付箋をつけることで,効率的にゲノム情報にアクセスできるというのがエピゲノムの役割の一つである。エピゲノムはゲノムと同様に細胞の分裂や個体が子孫を残すさいに引き継がれることもあるが,生育環境などの状況に応じて逐次貼り替えられることもある。エピゲノムは個体の発生に重要なだけでなく,ゲノム中の有害な遺伝子の働きを封じ込めたり,がんなどの病気に深く関わったりすることが知られているため,エピゲノムのはたらく仕組みや制御メカニズムの研究が盛んに行われている。
エピゲノムの研究分野における重要な課題として,どこにどのエピゲノム情報を書き込んだり消去したりするかがどのように決まっているのか?という疑問がある。つまり付箋が適切なところに付けられる仕組みというわけである。
私たちはこの仕組みを明らかにするために, 動植物を含む多くの生物に共通して存在するエピゲノム修飾を題材として研究をおこなった。修飾を書き込む酵素タンパク質は書き込み時には目的領域に接近するはずなので,それがゲノム中のどの領域に存在するかを調べれば,書き込みのルールが分かると予想された。そこで,書き込み酵素の存在パターンを実験的に調べ,その存在パターンがどのように決まっているかを,機械学習を用いて探索するというアプローチで研究を行った。その結果,同じエピゲノム修飾を書き込む酵素の中にも,別々のルールで書き込み場所が決まっているものが存在することが明らかになった。
ある酵素は,遺伝子情報が読み取られる(転写される)さいにエピゲノムの書き込みをおこなっており,別の酵素は他のエピゲノム情報やDNA配列情報を手がかりとして働いていることが示唆された。つまりある酵素は遺伝子転写の「記録」としてエピゲノムを書き込んでおり,別の酵素はゲノムや他のエピゲノム情報を「解読」してエピゲノムを書き込んでいると考えられる(図)。またこの大別すると2つのエピゲノム書き込み様式は植物と動物という進化的に遠く離れた生物に共通して見られることも明らかになった。本研究で行われたように実験と解析を繰り返していくことによって,複雑なエピゲノム制御機構が紐解かれていくことが期待される。
本件研究成果は,S. Oya et al., Nature Communications 13, 4521(2022)に掲載された。