2026年05月17日

## 要約:
カーネギーメロン大学の研究者が、AIエージェントがGoogleのV8エンジン脆弱性を悪用する能力を測る新しいベンチマークを開発しました。Claude MythosがGPT-5.5を大きく上回る性能を示しましたが、そのコストは12倍に達しています。この結果は、AIの進化におけるセキュリティ上の懸念を高めます。
---
## 翻訳:
カーネギーメロン大学の研究者が、AIエージェントがGoogleのV8エンジンにおける実際の脆弱性を悪用する能力を評価するための新しいベンチマークを構築しました。このベンチマークの結果、Claude MythosはGPT-5.5を大幅に上回る性能を示しましたが、そのコストは12倍という高額でした。記事「新ベンチマーク:Claude MythosとGPT-5.5が自律的にブラウザ脆弱性を悪用可能」はThe Decoderに先に出版されました。
[📰 原文はこちら](https://the-decoder.com/new-benchmark-shows-claude-mythos-and-gpt-5-5-can-develop-real-browser-exploits-autonomously/)
---
※本記事はAI(Ollama)による自動翻訳・要約です。
BittensorManがお勧めするメーカーリスト
https://exbridge.jp/xdirect/
AI時代の技術と知識のまとめ(AI生成メディア) - AIDexx
https://exbridge.jp/aidexx/
頑張って働く人に向けて、プロ用仕事アイテムを格安でネット販売しているX-Direct( https://exdirect.net )を、BittensorManは応援しています。
動画の最後にお得な情報がありますので、
最後までご覧ください。