
言語学者、生成AIを危ぶむ
2026年4月26日 CATEGORY - 代表ブログ

皆さん、こんにちは。
前々回の「日本語の秘密」、前回の「『あ』は「『い』より大きい!?」に引き続き、慶應大学の川原教授の著作第三弾「言語学者、生成AIを危ぶむ」をご紹介します。
著者が本書を書くことを決意した決定的な出来事は、「生成AIを搭載した子供向けのおしゃべりアプリが開発されている」というニュースに触れたことだと言います。
AIの脅威はいろいろ言われていますが、それは私たち人間の存在がそれと同等の仕事をこなすことができるAIに「とって代わられてしまう」ことに対する脅威だったはずが、この出来事は、まっさらな人間である幼児がAIに「教育される」という全くレベルの異なる脅威の存在に関する告白であり、私も著者のこの告白に触れた時にその脅威の大きさをすぐさま共有しました。
以下に、本書の主張を要約の上、自分なりにまとめてみたいと思います。
そもそも生成AIの出力は「あたかも人間が話しているかのよう」だが、AIと人間言語では、習得するために使うデータの質が決定的に違うため、見た目は変わらないように見えても、それを生み出すメカニズムは全く別です。
具体的には、AIが学習に使っているものは主にインターネット上のテキストデータであるのに対して、人間の赤ちゃんは「音声的な語りかけ」を通じて言語を学ぶわけで、著者の心配はいたって合理的なものであると私も捉えました。
AIの言語習得の概要を「AIが学習に使っているものは主にインターネット上のテキストデータである」とした説明には今まで私も何度も触れてきましたが、本書にはその仕組みがかなり体感的に理解できる説明がありましたので、以下その部分を引用します。
「生成AIの学習は『大規模言語モデル』を基盤とします。その方法とは例えば以下のような文があったとして、それぞれの赤字部分を隠します。
1.今日、朝ご飯に食べたのは納豆。
2.私は昨日焼肉屋さんでご飯を食べた。
3.川原繫人が専門とする研究分野は言語学。
その上で、赤字部分に入る単語を機械が自分自身で予想して、答え合わせを行うことを『大規模』に行います。このような訓練を経ると、1.の文の赤字のところには、『納豆』『しゃけ』が入る確率は高いが、『靴』『忍者』などの単語が入る確率は低いことが学べるのですが、これを膨大な量の文章をもとに行います。」
つまり、AIの「ただいま」に対する「おかえり」は、「ただいま」の返答として「おかえり」が高確率で現れるという統計情報に従っているだけで、AIは「ただいま」の意味を理解していないし、「無事でよかった」の安堵の感情も含んでいないのです。
ただ「こういう文章に対してはこう返すべし」という「確率情報に基づいた応答」が極めて上手だというだけで、体験やそれがもとで生じる感情とともに言語を学ぶ人間のそれとはメカニズムが全く異なるものです。
でも、あまりにも大規模にそのような情報処理がなされ、繰り返しトレーニングが行われているために、まるで「理解して発せられた」ように見えるため、中身の見えない「魔法の箱(ブラックボックス)」として機能してしまっています。
そして、極めつけはその見え方があまりにも上手くいきすぎしまっていて、AIの専門家すらなぜそうなるのかその仕組みを理解できていないというのです。
このことにはものすごく驚き、そんなことはありえないでしょうと思ったのですが、ずいぶん前から実用化され、私たち人類になくてはならない技術になっている「全身麻酔」もなぜそうなるのか当の専門家である医学者たちも分からないのに社会に実装されているという意味で同じだと言います。
ただし、麻酔はその仕組みは分からなくてもその扱い方を熟知した専門家である麻酔医でなければ扱うことができないのに対して、AIは誰もが持っているスマホに搭載され、いつでも赤ちゃんとのコミュニケーションに使用されることができるような状態にある点で異なります。
つまり、正体不明の「ナニカ」に幼児の発達を託してしまっていいのか、うまく動いているうちは問題なくても、仮にAIが暴走したときに原理が分からない以上、修理の仕様がないというのが著者が抱く問題の本質なのです。
そしてやはりその問題を私たちがどう扱うべきなのかについては、人間の赤ちゃんは「音声的な語りかけ」を通じて言語を学ぶという点に立ち返る必要がありそうです。
というのも、人間言語の発生は200万年前とも言われる一方で、文字の発生は最も古いエジプト楔形文字が5000年前と言われ、この二つは比べるべくもなく、明らかに言語の本質は「音声」にこそあると言えます。
また、私たち人間はその音声(音の高さの変化)によってのみ複雑な気持ちを込めることができることを知っています。
このことだけを捉えただけでも、言語における二義的な存在でしかない文字(テキスト)ベースの「魔法の箱」に幼児の相手は務まるとはとても思えないでしょう。
とはいえ、著者は言語学者として生成AIをご自身の仕事に活用されており、もはやその活用なしに仕事を遂行することはできないということは十分に理解した上で、幼児のおしゃべりの相手としてAIを活用することとそれは厳密に区別すべきだという結論を出されています。
タバコやアルコール摂取、自動車運転免許などに関しては国としての規制があるのに、それらと同じように相対的に未成年者へのリスクが高いデジタルデバイスに関しては完全に親任せである現状はもはや国家的な損失をみすみす放置することに等しいと。
そして、私もそれに100%同意するものです。









