![]()
文からニュアンスを取出す
![]()
文章の各センテンスをLLM(大規模言語モデル)でベクトルに変換し、それをそのセンテンスの意味内容と、そのセンテンスが含むニュアンスに分解するような計算手法を考えたい、それによって、意味内容とニュアンスとはどのようにわかれるのか、表現とは何かを考えたい。
文章には、意味は同じであっても、表現やニュアンスが異なるものがある。「今日は暑い」「暑い天気だ」「今日は暑い日だ」「暑い一日だ」などは、基本的にどれも同じ意味であるが、そのまま入れ替えていいわけではない。表現としては異なるものであろうし、ニュアンスは異なるだろう。「自分は彼女に教えられた」と「彼女は自分に教えた」は同じ意味であるが、ニュアンスは大きく異なる。さらに、前者は視点が自分にあるし、後者は彼女にある、ので、ニュアンスだけでなく視点も異なるが、意味としては同じである。さらに、「彼女は私に教育した」「私は彼女から知恵を授かった」のように言葉を広げれば、意味の重なりは保ちつつも、表現の重みや手触りは大きく変化する。我々はこの違いを直感的に理解することはできるが、「具体的にどう違うのか」を言葉で説明するのは非常に困難である。
こういった言葉の雰囲気やニュアンスの違いが誤解を生むこともある。攻撃するつもりはなくとも攻撃しているように思われてしまうこともあり、誤解を解消しようとしても、「そういうつもりで言ったつもりはない」「いいや、そのように受け取れる」のような水掛け論になりがちである。誇大広告、エセ科学などの文章では、「よく考えれば論理的には正しいことを言っていないのに、なんとなく正しそうに感じさせる」ニュアンスが巧みに使われる。そのニュアンスから説明は正しいと受け取り、そのように期待してしまい、後から騙されたと訴えても、「文字通りの意味ではそんなことは書いていない」と逃げられてしまうだる。表現やニュアンスは「意味」と違って客観的な議論の土台に乗せにくいため、こうした誤解やトラブルの解消、そもそも議論することを難しくしている。
現在、表現やニュアンスの分析に関して技術がある分野は文学であろう。文学研究者であれば、分野に共通する暗黙的な分析方法に従って分析し、その文のニュアンスがどのようなものであるか、ある程度妥当で、一般的な説明をすることができるだろう。しかしこれも、分析の助けとなるようななんらかの特徴や背景がわかってないと難しく、すべての文章について分析できるわけではない。
このような文章のニュアンスを扱う方法として、現在LLMは大きな期待を集めている。LLMは、入力された文章を意味や表現、ニュアンスを含んだ高次元のベクトルに変換する。LLMはこの高次元のベクトルをもとにして、その文章に対する返事を生成する。ニュアンスに関する質問にも答えられるが、その解答がきちんと正しいかどうかは怪しい。だが、ベクトルに変換することで、なんらかのニュアンスの違いを獲得していることは間違いないようである。上記の「今日は暑い」と類する文章も、ベクトルに変換するとそれぞれが少しずつ異なるベクトルに変換される。その違いが、ニュアンスや表現の違いとしてLLMには見えているはずである。このニュアンスがどう違うのかを正確に記述することは難しくとも、それがどのようなものであるかをざっくり捉えたり、どれくらい違うものなのかをベクトルの違いからひもといていくことは可能であろう。
具体的には、ニュアンスが異なり同じ意味の文章を複数ベクトルに変換し、それらの分布を調べる。これを意味が異なる多くの文章について行えば、ニュアンスの違いがどのようにベクトルの違いとして現れるものなのかを、ざっくりと捉えることができるだろう。ニュアンスの異なりが明確である文章の、ベクトルの違いを参照すれば、他の文章のニュアンスの違いをひもとくことができるだろう。また、ニュアンスが大きく違うのか小さくしか違わないのか、ということも調べられるだろうし、そもそもニュアンスは文章を変えることでどれくらい変わりうるのか、も調べられる。
しかし、ここには難しさもある。ニュアンスがどのようなものであるのかがわからないため、検証が難しいこと、ベクトルの違いが同じであれば、ニュアンスの異なりは同じであるのか正確にはわからないこと、文章の意味の違いがニュアンスの異なり方に大きな影響を与える場合に、ニュアンスの違いの現れ方が変わってくる可能性もある。表現やニュアンスが見えにくいものであるため、多くの難しさがありそうである。
ニュアンスの違いは、文章の形から明確に指摘することが難しい。かといってLLMにニュアンスについて質問するような方法もあまりあてにならない。LLMが文章をどう捉えているかを内側から調べていくことで、ブラックボックス化しているニュアンスの正体を解き明かし、客観的に記述するための筋道が見えてくるかもしれない。
![]()