まるで人間のように会話をするAIを夢見て

人は言葉の意味をどんなふうに理解するのだろう

たとえば、スマホに向かって「東大はどこにあるの？」と聞けばちゃんと住所を教えてくれるし、音声入力でメールを書くこともできる。WEBのフランス語の新聞記事もあっという間に自動翻訳してくれるアプリは、逆に日本語をフランス語にもしてくれる。これらを可能にしているのが自然言語処理技術であり、それが卓越研究員のタイトルと自身の研究室を持つ谷中瞳講師が専門としている領域である。

谷中講師は自らの夢をこんなふうに語る。

「論理学や言語学のアプローチを組み合わせてより信頼性のある言語処理技術を作ることが目標で、人のように言葉を理解できる言語処理技術を実現したいと考えています。あたかも人と会話しているかのように人工知能（AI）と自然に会話できる日が実現できたらと思います」

とはいえ、その道は険しく、挑む頂はきわめて峻厳だ。現在、世界では機械学習で自然言語を処理しようという研究がほとんどであり、「論理学や言語学のアプローチを組み合わせて」実現しようという谷中講師の試みは、いまのところごく少数の研究者だけが取り組んでいる野心的なものなのだという。

自然言語とは私たち人間が日常の会話や読書などで普通に用いている言葉・文のことだが、それにしても、谷中講師。そもそも、「自然言語処理」とは一言で言えばいったいなんなんですか？

「一言ですか？難しいですね。自然言語をめぐる研究分野には本当にさまざまなものがあって、私たちの情報科学もそうですし、文系の言語学もそうです。認知科学ではどうやって人が言葉を習得していくのかを研究していますし、言葉とは何か、意味とは何かという概念から考えていく哲学的なアプローチもあります。しかし現実には、人はなぜこんなふうに自然に言葉を話し理解できるのか、まだあまりわかってはいません。でも、そんなふうにいろんな方面からなされている言葉の研究を集結させれば、人間らしい言葉の理解とは何かがわかるのではないかと思うのです。自然言語処理の多くの研究者は言葉を機械によって効率性などを考えながら処理する方法を研究しているのですが、これにそういったさまざまな分野の知見を取り入れ、言葉の意味を人が理解する仕組みを解明すること、それが私が考えている自然言語処理の研究なのかなと思います」

深層学習のブラックボックス

1960年代に自然言語処理研究の最初のブームが起きたとき、自動翻訳は巨大な辞書を用意さえすれば簡単にできるはずだという楽天的なムードがあったという。だが、もちろんそんな簡単なはずもなく、ようやく実用的なものが登場したのは、コンピュータの発達も相まって深層学習（ディープラーニング）が飛躍的な進歩を遂げた最近のことである。

「深層学習を使って膨大なデータから統計学的に学習した言語モデルを作り、それを翻訳タスクとか対話タスクとかに適用する手法が活発に研究されているのですが、そういったモデルの中には、人と同じレベルで言葉を理解する精度を達成したと謳っているものもあります。でも、深層学習を用いた技術では、なぜその入力からその出力が得られたのかという過程がブラックボックスであり、本当に人のように言葉を理解しているのかはわからないのです」と谷中講師は指摘する。

コンピュータで言葉を処理するには、言葉を機械がわかるコトバ、つまり数字などの記号に変換する必要がある。そのため、深層学習を用いた技術では、単語の意味をベクトルで表す。Aという単語とBという単語が似ているかどうかは、そのベクトルがどれくらい同じ向きを向いているのかで判断するわけだ。こうすることで、「意味を理解する」ことは「ベクトル空間で計算する」という作業に置き換わる。膨大な言葉・文を深層学習によって、統計学的、確率論的に分析することがこれで可能になる。谷中講師が「ブラックボックス」というのは、この統計学的、確率論的な過程のことであり、それは実際的で役に立つかもしれないが、人間の脳が行っているプロセスとは異なっているのではないかという疑問のことなのである。

「言語処理以外の分野、たとえば言語学ではこういう文は文法的に正しく、こういう文は正しくないといった言語に関する膨大な知見の蓄積があります。あるいは哲学であれば、人間が使う言葉には、いくらでも生み出せるという生産性、規則的なものを備える構成性、そして体系性というものがあるという考えがあります。体系性というのは、たとえば『ボブはジョンを愛している』という言葉を初めて聞いた時に『ジョンはボブを愛している』という言葉も人は理解できるという、言葉の背後に隠れている体系を人間は自然に獲得して使うことができるということなのですが、こういったいろいろな分野からのさまざまな知見を使って、深層学習が言葉の意味や文法を理解しているのかどうかを評価することも、私の研究の一つです。自分が立てた仮説に基づいて深層学習のパラメーターをいろいろに調整するなどしてコンピュータ上で検証するのですが、たいへんな作業ですね（笑）」

人のように推論できるシステムを

それは深層学習そのものを改良していくという方向だが、限界があると谷中講師は感じている。谷中講師がいま追い求めているのは、深層学習にまったく異なる方法をプラスするという発想だ。それが、「記号論理の融合による自然言語推論技術」というものである。難解な用語だが、谷中講師曰く、一言で言えば「人間らしい推論」のことだと。

「深層学習ではたとえば二重否定や三重否定、あるいは数量的な表現などは学習が難しいことが知られています。深層学習の技術で作られている評判がよい自動翻訳アプリでも、二重否定の文章などはうまく翻訳できません。一方、記号論理（形式論理）はそういう否定や数量を扱うことに適しています。たとえばベクトルでは『すべての』を表現するのは難しいですが、論理式では簡単です。この記号論理によってあらかじめ文法的な規則などをモデルに直接教えたほうが効率はよいのです。深層学習が帰納的な方法なら、これは演繹的な方法とも言えますが、つまり、深層学習に記号論理を組み合わせることによって、人間らしい推論が実現できるのではないかと考えているのです」

いわば深層学習との複合的なシステムを構築しようというのである。

「たとえば、AとBの二つの文を論理式に変換し、論理式間の証明で『AならばBが成り立つ、かつ、BならばAが成り立つ』となればAの文とBの文の意味は同じということになります。そういうふうにAとBがどれくらい似ているかを記号論理で判定します。一方で、リンゴとミカンという語の文中の出現傾向が似ているといったような面では深層学習のほうが得意なので、そういったことは機械学習に任せる。つまり、情報を互いに補完しあうことで、推論を進めていくわけです」

実際、人間の脳の中でも、そういった形式論理的な部分と、ニューラルネットワーク的な部分の両方があるのではないかと言われているという。認知科学の分野でのシステム・ワンとシステム・ツーといった仮説のことだ。システム・ワンはニューラルネットで『この文とこの文の集合が、似ている文の候補だ』と大雑把に調べ上げ、その詳細をシステム・ツーの論理的な部分が文法的、規則的な面をチェックする。人の認知機構もそういう構造になっているのではないかというのである。

それにしても、言語処理とは、なんという広大なフロンティアなのだろう。言葉とは、当の私たち自身が話したり聞いたり書いたり読んだりしているものであるのに。

「日常の言語を『現象』としてみると、否定、数量、時間関係、比較などなど、本当にさまざまな現象があります。このうち一つの言語現象についてだけでも、頑健に意味を表し、人のように推論できるシステムを実現できたらと思っています。近いうちに、なんとか」

研究とジャズは似たもの同士

修士課程での谷中講師の専攻は言語処理と縁もゆかりもない応用化学だった。ところが、卒業後に勤めた企業では、特許検索システムの開発や運営をまかされることとなる。博士課程に進学し直すことを決めたのは、このときに聞いた多くの顧客からの要望がきっかけだったという。

「お客様は、もっと賢く特許文を検索できないのかと言うんですね。自由文レベルでの検索や、否定文が入っている文とそうでない文どうしでも意味が似ているかどうかを判定できないか、あるいはファクトチェックのようなことが自動でできないかとか。こういったニーズは金融ドキュメントや医療電子カルテなどでもあると思いますが、この手のことは人がやるしかありませんでしたし、あまり研究もされていませんでした。それで博士課程に入り直して自分で研究を始めようと思ったのです」

研究を始めて気づいたのが、言語処理の研究というのは文理融合的な側面が強いということ。哲学が使用する言語は論理であり、一方、論理学は情報科学の基本でもある。そういった面からも、理系の研究者だけでなく文系の研究者との交流も研究には欠かせなくなった。

「哲学や言語学の論文もたくさん読みますし、議論をする先生方も哲学や言語学の先生が多く、それぞれの分野は本当に奥が深いなと思います。機械学習も技術的にすごいのですけど、どういうアルゴリズムがよいかとか、どうすれば学習効率がいいかとか、そういう話はよくあるのですが、言葉の中身ということには深く触れない研究が多いのです。一方、言語学や哲学は一つの文に対して緻密な分析をしたり、激しい論争もあったり。とにかく、いろんな文献を読めば読むほど自分が何も知らないことに気づかされるのですね」

そんな谷中講師だが、実は高校時代は倫理の授業が大好きだったのだという。

「そのころから哲学にも言語学にも興味があったのですが、それが後々に生きてきたという感じですね。ニーチェやウィトゲンシュタインなども読みましたが、あの時もっと追求すればよかったなって思う時もあります」

そして谷中講師はこう続ける。

「学生さんたちに言いたいのですが、いま自分が興味を持っていることがあるのなら、まずはそれを一生懸命に追求してください。『思い立ったが吉日』と言いますが、面白いなと感じたことがあったらその時に追求することが大事だと思いますよ」

谷中講師はアマチュアのジャズ・ピアニストでもある。始めたのは大学からで、ジャズ好きの父の影響だった。お気に入りのアーチストはビル･エバンス。

「研究とジャズは、自分の中では似たものどうしなんです。研究もジャズもとにかく自由にっていうところがありますし、周りの人とインタラクティブであることがとても大事で、そのへんが互いに似ていると思いますね。テーマ自体は自由だけど決まっていて、その一つのメロディーをいろんな人と一緒に作り上げていく感じが、研究ともすごく似ています」

ビル･エバンスの『イスラエル』という曲を完全コピーしたくてピアノを一日中練習し続けるなど、一つのことに没頭するととことん追究しないと気がすまない性格だと語る。プログラミングでも音楽でも、何かを創り出しているときが一番楽しい時間なのだという。

さて、谷中講師。今後の研究者としての目標は何ですか？

「いつまでにこれこれをしようというよりは、ずっと一生続けるみたいな、研究ってそういうものかなと、最近ちょっと思うようになりました。哲学の先生に、88歳でも元気で現役の方がいらっしゃるんです。言語学者や哲学者ってどんなに年を取っても現役っていう方が多いのですね。ですから、淡々と生活するように研究したいというのは一つあるかもしれないですね。でも、目標をもっと持った方がいいのかなって、今ちょっと、インタビューされて、そう思いました。はい、逆に（笑）」

※2022取材時
文／太田稔
写真／貝塚純一