2026年01月23日
## 要約:
言語モデルの評価において、ローリソース言語での質問応答の質が低いことが判明した。言語選択によってモデルが使用する文化的情報や文脈が変化することが確認された。この文化的文脈の差異が、最終的な回答の質に影響を与えている。
---
## 翻訳:
arXiv:2601.15337v1発表型:新規
概要:LLMと対話する際に利用する言語によって、ユーザーが系統的に不利になるべきではない。つまり、利用する言語に関わらず、同様の品質の回答を得られるべきである。本研究では、WildChatデータセットの分析に基づいて、現実世界のオープンエンド形式の質問セットを作成し、言語によって応答が異なるかどうか、具体的には、言語によって回答の質が左右されるかどうかを評価した。また、LLM-as-a-Judgeを用いて、言語選択によって応答に含まれる文化的情報や文脈がどのように変化するかを調査した。さらに、複数の言語でCulturalBenchベンチマークの翻訳サブセットを用いてLLMを評価した。評価の結果、LLMはローリソース言語でオープンエンド形式の質問に対する回答の質が低い傾向にあることが明らかになった。言語がモデルが使用する文化的文脈に大きな影響を与えることが確認され、この文脈の差異が最終的な回答の質に影響を与えている。
[📰 原文はこちら](https://arxiv.org/abs/2601.15337)
---
※本記事はAI(Ollama)による自動翻訳・要約です。
BittensorManがお勧めするメーカーリスト
https://exbridge.jp/xdirect/
AI時代の技術と知識のまとめ(AI生成メディア) - AIDexx
https://exbridge.jp/aidexx/
頑張って働く人に向けて、プロ用仕事アイテムを格安でネット販売しているX-Direct( https://exdirect.net )を、BittensorManは応援しています。
動画の最後にお得な情報がありますので、
最後までご覧ください。