アルゴリズムとは何か (研究者向けの解説)

作品世界を説明するVR・LLM

　時代や文化が異なる芸術作品や物語を鑑賞するには、その作品の時代や文化を理解すれば鑑賞の体験は良くなる。その時代や文化を鑑賞者や作品に応じて必要なものを適切に説明し、体験できるLLM(大規模言語モデル)とVRを組合せたシステムは作れないか。

　文学作品や詩、あるいは人の語りを深く理解しようとするならば、その作者や語り手が置かれていた状況や心理状態を理解する必要がある。そのために、作家が暮らした地域、属していたコミュニティや社会、日常的に目にしていた風景、口にしていた食べ物などを調査することが行われる。たとえば日本の江戸時代の書物を理解しようとするならば、当時の人々の生活様式、町人が書いたものであれば町人の生活実態、その作品の読者層や読者の感想、さらには当時の社会情勢や倫理観などを把握していれば、作品をより深く理解できるであろう。作家の心情や読者の感情を想像しながら、共感をもって読むことも可能になる。
　しかし、このような時代背景の知識を得ることは、多大な労力を要する。関連文献を広く調査し、多様な視点から知見を積み重ねなければならない場合も多い。さまざまな断片的知識が統合されて初めて、その時代の雰囲気が見えてくることもある。しかも、それらの文献は俯瞰的な歴史記述であったり、特定の個人の視点に偏ったものであったりするため、読者自身の立場からは距離があり、実感や共感を得にくいことも少なくない。
　世界を伝える別の方法として、VR（仮想現実）を用いる手法がある。VRでは視覚的に現実を高い精度で再現でき、その空間を自ら歩き回ることができる。すなわち、世界の内部を自分が移動するという体験が可能になる。この点において、共感や実感を得にくいという文献中心の理解方法とは対照的な強みを持つ。一方で、視覚的体験の質は高いものの、社会的雰囲気や倫理観、道徳観といった一般常識的概念を体感することは容易ではない。また、その世界に生きる人々のふるまいや感情を十分に知ることも難しい。
　そこで、異なる時代・世界・社会をより詳細に理解し、実感を伴って体験できるようにするために、VRとLLM（大規模言語モデル）を組み合わせた説明装置を作るのはどうだろうか。LLMには膨大なデータを入力できるため、たとえば特定の時代・地域・職業に属する人々の生活様式や思考、社会構造を整理することが可能である。その整理結果をもとに生成AIを用いれば、当時の村や町並みを仮想空間として再構築できるであろう。社会の雰囲気や暗黙のルールを伝える情景も生成可能である。必要な情報を詰め込んだ情景やストーリーを作り、それを多角的な視点から説明すれば、多大な労力をかけることなく、目的や場面に応じた適切な解説を与えることができる。解説を受ける側にも大きな効果があるだろう。
　さらに生成AIは、利用者の状況や関心に応じて、対象作品を適切な視点から解釈し直した説明を構築できる。細かな状況変化に応じて解釈や説明を柔軟に生成できる点は、従来の固定的メディアにはなかった大きな利点である。社会的状況や個人の感情、倫理観・道徳観といった抽象的要素を含む体験を、視覚や音響、言語的説明を組み合わせて、目的や場面に応じて構築することも理論上は可能である。
　文章による説明は、直接見ることや感じることができない知識、社会規範、人間関係、文化や価値観などを伝えることに長けている。VRは視覚・聴覚を伴う時空間的移動体験を可能にし、高いリアリティと共感性を生む。LLMや生成AIは、目的や利用者に応じて適切な仮想世界や説明を構築できる。これらを組み合わせれば、文学作品や詩を深く味わうための前提知識や社会的背景を、体験可能な形で提示するシステムが構築できる可能性がある。研究者が長年かけて到達するほどの深い理解には及ばないとしても、一定水準の質を担保した理解環境は実現できるのではないか。
　もっとも、このような体験は従来の文章的物語や映像作品とは異なる性質を持つであろう。映像によって物語性を極限まで高めた形式の一つが映画であるが、映画は状況理解や感情喚起には強みを持つ一方、VRが持つ「能動的に行動し、世界からフィードバックを得る」という特性は弱まる。博物館の解説動画のような形式も同様である。逆に、VRでは利用者が能動的に動くがゆえに、ストーリーや説明に沿った体験を統制することが難しく、社会構造や感情、文化といった意味的要素を的確に伝えることが困難になる。両者の強みを併せ持つシステムとは何か、その設計こそが興味深い研究課題となるであろう。
　さらに別の研究可能性もある。文学作品や絵画、詩、思想などを分析する際には、まずそれらが生まれた時代や社会を調査し、ある程度理解したうえで解釈を行う。しかし、その理解は人によって異なるため、多様な研究が生まれる一方、共通の基盤から出発して議論することが難しくなる。LLMは高度で独創的な解釈を生み出すとは限らないが、少なくとも一定水準の質を保った、客観性と再現性を備えた説明を提示できる可能性がある。概念、感情、社会状況、当時の景観や感覚といった解釈の揺れやすい対象に対して、議論の出発点となる共通の基盤を設定できるかもしれない。たとえば、江戸時代の町並みを再現したVR空間を多くの人が体験し、その観察や感覚を共有したうえで議論を始めれば、少なくとも同一の体験を基軸に議論できる。各自が想像の中で構築した町並みを前提に議論する場合とは大きく異なる。
　生成AIの生成物が近い将来に人間の作品と同等の意味や質を持つようになるとは考えにくい。しかし生成AIは、再現性や客観性といった、人間が必ずしも得意としない特性に強みを持つ。人間とは異なる強みを持つ技術を用いれば、人間が行ったものが持つ価値とは異なる価値が生まれるのは当然である。ここで述べた構想は、そのような既存の価値とは異なる価値を提供する試みとして位置づけられる。そこから多様な応用可能性が広がり、新たな価値創出につながる可能性があるだろう。
　

　戻る　　宇野毅明のホームページへ