2026年05月25日

## 要約:
本研究では、LLMエージェント間のテキストベースの通信における遅延と情報損失を解決するため、新しいモデル間通信手法「潜在キャッシュフロー(LCF)」を提案します。LCFはKVキャッシュを効率的に共有し、異なるコンテキストでも高い精度と高速性を実現します。実験結果から、LCFは従来のキャッシュ共有方式よりも大幅に軽量で高性能であることが示されました。
---
## 翻訳:
arXiv:2605.22863v1で発表された新しいタイプの研究です。
LLMエージェントは現在、テキストを通じて通信を行っており、共有モデルの状態を自己回帰的にデコードし、受信モデルでエンコードする必要があるため、かなりの遅延と情報損失が発生します。Cache-to-Cache (C2C)のような最近の研究は、アダプターを学習して共有者のKV行列を受信モデルに変換することでKVキャッシュを交換しようとしています。しかし、アダプターは大きく、訓練にコストがかかり、個々のトークンを翻訳するため、ターゲットコンテキストが同一である必要があります。これは、LLMが異なるコンテキストを持つエージェントの通信には適していません。
そこで私たちは、潜在キャッシュフロー(LCF)を導入します。効率性を向上させるために、キーと値は共同で翻訳および圧縮できることに着目し、アダプターをC2Cの約4%のサイズに削減しました。また、異なるコンテキストに対応するために、アダプターはターゲットモデルが持たない新しい情報の概要を送信するように設計しました。初期実験の結果、13MBのLCFアダプターは、共有コンテキスト環境において956MBのC2Cアダプターよりも正確であり、異なるコンテキストではテキストベースの通信よりも23%正確で8.5倍高速であることがわかりました。
[📰 原文はこちら](https://arxiv.org/abs/2605.22863)
---
※本記事はAI(Ollama)による自動翻訳・要約です。
BittensorManがお勧めするメーカーリスト
https://exbridge.jp/xdirect/
AI時代の技術と知識のまとめ(AI生成メディア) - AIDexx
https://exbridge.jp/aidexx/
頑張って働く人に向けて、プロ用仕事アイテムを格安でネット販売しているX-Direct( https://exdirect.net )を、BittensorManは応援しています。
動画の最後にお得な情報がありますので、
最後までご覧ください。