ページ

2026年2月26日木曜日

ACAR:監査可能な意思決定経路を持つマルチモデルアンサンブルのための適応的複雑性ルーティング

#aidexx #news

2026年02月26日




## 要約:
ACARは、マルチモデルアンサンブルの性能を評価し、最適な実行モードを決定するためのフレームワークです。自己整合性のばらつき(sigma)に基づいてタスクをルーティングすることで、単純なモデル単独の実行から、複数のモデルを組み合わせるまで、最適な実行戦略を選択します。この手法は、既存のアンサンブルよりも精度を向上させながら、不要な計算を削減します。

---

## 翻訳:
我々は、監査可能な条件下でマルチモデルオーケストレーションを研究するための測定フレームワークであるACAR(Adaptive Complexity and Attribution Routing)を提示する。ACARは、N=3のプローブサンプルから計算される自己整合性のばらつき(sigma)を使用して、タスクをシングルモデル、ツーモデル、スリーモデルの実行モードにルーティングする。このシステムは、immutableなアーティファクトと完全な意思決定経路を備えた決定論的実行基盤であるTEAMLLMの上に実装されている。我々は、Claude Sonnet 4、GPT-4o、Gemini 2.0 Flashを使用して、MathArena、Reasoning Gym、LiveCodeBench、SuperGPQAの4つのベンチマークを跨る1,510のタスクでACARを評価し、7,550を超える監査可能な実行を生成した。結果は、sigmaベースのルーティングが55.6パーセントの精度を達成し、ツーモデルのベースラインである54.4パーセントを上回り、54.2パーセントのタスクでフルアンサンブルを回避することを示している。ルーティングメカニズムはモデル非依存であり、学習されたコンポーネントを必要としない。我々はまた、ネガティブな結果も文書化する。第一に、検索拡張は精度を3.4パーセントポイント低下させた。検索類似性のメジアンが0.167しか存在しなかったため、意味論的な整合性なく経験を注入すると、ノイズが導入されるのではなく、グラウンディングが不可能になることが示された。第二に、モデルが誤った答えで合意するとき(sigmaがゼロの場合)、どのダウンストリームアンサンブルも復元できない。この合意だが間違っている失敗モードは、自己整合性に内在しており、フルアンサンブルから約8パーセントポイント下回る精度に制約する。第三に、応答類似度やエントロピーなどのプロキシ信号に基づいた帰属推定値は、leave-one-out値の真実値との弱い相関を示す。これにより、実用的な帰属には明示的な反事実的な計算が必要であることが示唆されている。この研究は、実際にはどの仮定が失敗するかを記録し、ルーティング、検索、マルチモデル帰属の将来の研究のための検証可能な基準を提供する。

[📰 原文はこちら](https://arxiv.org/abs/2602.21231)

---

※本記事はAI(Ollama)による自動翻訳・要約です。

BittensorManがお勧めするメーカーリスト
https://exbridge.jp/xdirect/

AI時代の技術と知識のまとめ(AI生成メディア) - AIDexx
https://exbridge.jp/aidexx/

頑張って働く人に向けて、プロ用仕事アイテムを格安でネット販売しているX-Direct( https://exdirect.net )を、BittensorManは応援しています。

動画の最後にお得な情報がありますので、
最後までご覧ください。

「俳優」大悟 巨匠も認めた存在感

#aidexx #news 2026年05月23日 5/23(土) 19:36 デイリー新潮 「俳優」大悟、巨匠も認めた存在感 「歩くだけで画面が持つ」と感じるのは、なぜなのか 是枝裕和監督の「箱の中の羊」  第79回カンヌ国際映画祭のコンペティション部門に是枝裕和監...