2026年01月26日
## 要約:
本研究では、大規模言語モデルにおける自然な中国語と英語のコードミックス生成能力を評価するための新しいベンチマーク「ChiEngMixBench」を開発しました。コードミックスを翻訳問題として捉えるのではなく、文脈に即した自然な生成能力を測ることを目的としています。ベンチマーク評価の結果、大規模言語モデルにおける用語の階層化戦略という興味深い現象が観察されました。
---
## 翻訳:
arXiv:2601.16217v1 公告タイプ: 新規
抄録: コードミックスは、人間と大規模言語モデル間のインタラクションにおいてますます蔓延していますが、既存の研究はそれを翻訳または相互変換の問題に矮小化することが多く、モデルの切り替え動作が文脈に適切であり、人間の慣習に合致しているかどうかを評価することが困難です。私たちは、本研究で、ChiEngMixBenchを導入します。これは、本物のコミュニティの文脈におけるコードミックス能力を評価するように設計された最初のベンチマークであり、ドメインやバイリンガルペアを横断してスケーラブルなデータセット開発を可能にする一般的な構築パイプライン上に構築されています。ChiEngMixBenchは、コードミックスを、自発性と自然さという補完的な信号によって特徴付けられる認知アライメントの問題として定式化します。経験的な評価により、私たちのメトリックはモデル間でコードミックスのパフォーマンスを体系的に区別できることが示されました。ベンチマーキングに加えて、私たちはさらに暗黙的に出現する用語階層化戦略を明らかにしました。これは、マトリックス言語フレーム(MLF)理論と一致する現象であり、多言語大規模言語モデルと人間のコミュニケーションとの間の構造化された認知アライメントを示唆しています。
[📰 原文はこちら](https://arxiv.org/abs/2601.16217)
---
※本記事はAI(Ollama)による自動翻訳・要約です。
BittensorManがお勧めするメーカーリスト
https://exbridge.jp/xdirect/
AI時代の技術と知識のまとめ(AI生成メディア) - AIDexx
https://exbridge.jp/aidexx/
頑張って働く人に向けて、プロ用仕事アイテムを格安でネット販売しているX-Direct( https://exdirect.net )を、BittensorManは応援しています。
動画の最後にお得な情報がありますので、
最後までご覧ください。