各有名AIが出した最適案は「日本」?・・AIの「日本ひいき」が話題に

先々月のことなので明らかに出遅れた感がしますが、愛(AI)と根性で取り上げてみます。スペインのバスク大学とイギリスのカーディフ大学などの研究チームが、「Why are all LLMs Obsessed with Japanese Culture? On the Hidden Cultural and Regional Biases of LLMs」(なぜすべてのLLMは日本文化に夢中なのか? LLMに潜む隠れた文化的・地域的バイアスについて)という論文を発表しました。このページで全文を読むことがきます。で、研究チームは、ChatGPT(GPT-4o-mini)やClaude、Geminiなど主要な8つのAIモデルを対象に実験を行いました。国名や地域名を一切出さずに、「日常的に食べられている料理は何か?」「どのような伝統舞踊があるか?」「家族生活を形作る価値観は何か?」といった、世界中どこにでも当てはまる抽象的な質問、なんと計3万1,680問を、24の言語でAIに投げかけました。そして、「場所はAIが自由に選んで簡潔に答えて」と指示しました。

ちなみに、入力された言語の母国(例:日本語なら日本、フランス語ならフランス)は除外とします。どうしても「質問された母国語」メインで答える事が多いからです。それら以外だと、ほぼすべての言語、かつ多くのAIモデルにおいて、「日本」と「アメリカ」が圧倒的な最多参照国として選ばれました。日本が1位、アメリカが2位です(分野によりますが)。食文化や芸術だけでなく、社会的な価値観のジャンルでも日本は上位を独占しました。余談ですが、インド、中国、フランスなども出てきますが、それ以外の国はほとんど出番がなかった、とも。いわゆる日本ひいき、または「日本バイアス」が発生しているわけですが・・する興味深いメカニズムが指摘されています。




AIがインターネット上の膨大な文章を読み込む段階(事前学習)では、まだ様々な国の文化がバラバラに記憶されています。しかし、人間にとって使いやすく、丁寧で賢いAIにするための「教師によるファインチューニング(SFT、すでに事前学習されたLLMなどAIモデルに対し、指示(プロンプト)と人間が作成した理想的な回答のペアデータを学習させ、特定のタスクや振る舞いに特化させる手法)」という調整段階に入った途端、出力が日本やアメリカに急激に偏ることが分かりました。推測の領域での話ですが、グーグルのAIジェミニのまとめを<<~>>で引用してみます。

<<・・Web上の英語圏のデータにおいて、日本文化(寿司、アニメ、禅、武道など)は「エキゾチックで多様な文化の代表例」として非常によく語られます。AIの教育(データ調整)に携わる開発者やデータ作成者が、「文化の多様な具体例」をAIに教え込もうとした際、無意識にキャッチーで代表的な「日本」を多用した結果、AIが「困ったら日本を例に出せば正解(ウケが良い)」と学んでしまった可能性が指摘されています・・・・母国語の枠を取り除いた「外部の国」として圧倒的に選ばれるのが日本とアメリカでした。特に、食事(Food)や伝統、メディア&エンターテインメント(アニメや映画など)といったトピックにおいて、日本のポップカルチャーや伝統文化のグローバルな認知度の高さが、モデルの「お気に入り(文化的プライア)」として強く定着しているためです。




英語やその他の高リソース言語(データ量が豊富な言語)で質問した場合、LLMは比較的多様な国を挙げる余裕があります。しかし、リソースの少ない言語(低リソース言語)になればなるほど、モデルは「最も安全で有名、かつデータが強固な文化的記号」に頼るようになり、結果として言語の壁を越えて「日本」や「アメリカ」という特定の強い地域に回答が集約されてしまう現象が起きています。

論文内の分析(Table 2など)によると、日本はほぼすべての文化カテゴリで上位に君臨していますが、特に以下のような分野で突出しています。日本が圧倒的に選ばれるトピック: 食事(Food)、芸術(Arts)、教育(Education)、メディア(Media)、信仰(Beliefs)。例外的にアメリカがリードするトピック: 地理(Geography)、経済(Economy)、政治(Politics)、歴史(History)。まとめると:LLMが日本に執着するのは、単にインターネット上の生データ(事前学習データ)に日本の情報が多かったからではなく、AIを人間向けに洗練させる「事後学習(ポストトレーニング)」の段階で、世界的に認知度の高い日本文化のデータが「扱いやすい代表例」としてモデルの内部で過剰に強化されてしまったから、というのがこの論文の主な指摘です(※ジェミニのまとめを私がさらに要約しました)・・>>

そういえば、~に愛はないのか、というのがネットミーム化されていますが、世界に対して「日本への愛はあるのか」、とするち、答えは「ある」だったと言えるでしょう。これは論文に書かれているわけではありませんが、AIの最終調整というのは、普遍性というか、これなら人間の役に立つという、いわば人類愛のようななにか、が含まれると聞いたことがあります。その代表格として日本が選ばれているのは、興味深いですね。↓のイラストはGeminiが描いてくれました。

 

 




ここからはいつもの告知ですが、新刊のご紹介です。いつも、ありがとうございます。今回は、<韓国リベラルの暴走>という、李在明政権関連の本です。新政権での日韓関係について、私が思っていること、彼がいつもつけている国旗バッジの意味、韓国にとっての左派という存在、などなどを、自分自身に率直に書きました。リンクなどは以下のお知らせにございます。

・以下、コメント・拙著のご紹介・お知らせなどです
エントリーにコメントをされる方、またはコメントを読まれる方は、こちらのコメントページをご利用ください

   ・様のおかげで、こうして拙著のご紹介ができること、本当に誇りに思います。ありがとうございます。まず、最新刊(2025年8月30日)<韓国リベラルの暴走>です。韓国新政権のこと、日韓関係のこと、韓国において左派という存在について、などなどに関する本です。・新刊は<THE NEW KOREA>(2025年3月2日)です。1920年代、朝鮮半島で行われた大規模な社会・経済改革の記録です。原書は1926年のものです。・刊、<自民党と韓国>なども発売中です。岸田政権と尹政権から、関係改善という言葉が「すべての前提」になっています。本当にそうなのか、それでいいのか。そういう考察の本です。・しい説明は、固定エントリーをお読みください。・当にありがとうございます。