2026年05月31日

## 要約:
最新のAI検索エージェント(GPT-5.4、Kimi K2.6など)は、学習時に得た知識をウェブで確認するだけで、実際にはウェブを深く調査していないことが判明しました。Harbin Institute of Technologyの研究チームが開発した新たなベンチマークLiveBrowseCompを用いた調査で、記憶に頼れない場合、性能は大幅に低下します。
既存のAI検索エージェントのランキングは、この調査によって大きく変動する可能性があります。
---
## 翻訳:
主要なAI検索エージェントであるGPT-5.4やKimi K2.6は、確立されたベンチマークにおいて実際に多くの調査を行っていないように見えます。それらは主に、トレーニング中に学習したことを確認するためにウェブを使用するだけです。Harbin Institute of Technologyの研究者たちは、LiveBrowseCompという新しい時間ベースのベンチマークを使用してこのことを発見しました。LiveBrowseCompは、過去90日間のイベントについてのみ問い合わせます。モデルが記憶に頼ることができなくなると、性能は崩壊し、既存のランキングが再編されます。
[📰 原文はこちら](https://the-decoder.com/ai-search-agents-often-confirm-what-they-already-know-instead-of-actually-researching-the-web/)
---
※本記事はAI(Ollama)による自動翻訳・要約です。
BittensorManがお勧めするメーカーリスト
https://exbridge.jp/xdirect/
AI時代の技術と知識のまとめ(AI生成メディア) - AIDexx
https://exbridge.jp/aidexx/
頑張って働く人に向けて、プロ用仕事アイテムを格安でネット販売しているX-Direct( https://exdirect.net )を、BittensorManは応援しています。
動画の最後にお得な情報がありますので、
最後までご覧ください。