大規模言語モデルの嗅覚認識能力評価のためのベンチマーク

2026年4月2日木曜日

大規模言語モデルの嗅覚認識能力評価のためのベンチマーク

#aidexx #news

2026年04月02日

## 要約：
この論文では、大規模言語モデル（LLM）の嗅覚に関する推論能力を評価するための「Olfactory Perception (OP)」ベンチマークを導入しました。ベンチマークは1010の質問を含み、様々なタスクを通じて嗅覚に関する知識を測ります。実験の結果、化合物名によるプロンプトの方が、構造式によるプロンプトよりも高い精度を示し、言語モデルは主に語彙的な関連性で嗅覚の知識を利用していることが示唆されました。

---

## 翻訳：
arXiv:2604.00002v1 Announce Type: new
要旨: ここで、大規模言語モデル（LLM）の嗅覚に関する推論能力を評価するために設計された「嗅覚認識 (OP)」ベンチマークを紹介します。このベンチマークには、臭気分類、主要な臭気記述子特定、強度と快感の判断、マルチ記述子予測、混合物の類似性、嗅覚受容体の活性化、現実世界の臭気源からの匂い特定など、8つのタスクカテゴリにまたがる1,010の質問が含まれています。各質問は、化合物名と異性体SMILESの2つのプロンプト形式で提示され、分子表現の影響を評価します。主要なモデルファミリーの21種類のモデル構成を評価した結果、化合物名によるプロンプトが常に異性体SMILESによるプロンプトよりも優れた性能を発揮し、+2.4〜+18.9ポイント（平均約+7ポイント）の改善が見られました。これは、現在のLLMが嗅覚に関する知識を主に語彙的な関連性によってアクセスしていることを示唆しています。最も優れたモデルの全体的な精度は64.4％に達し、これは新興能力と嗅覚に関する推論の残された大幅なギャップの両方を強調しています。さらに、OPのサブセットを21言語で評価したところ、言語間での予測の集計が嗅覚予測を改善し、最適な言語アンサンブルモデルではAUROCが0.86になりました。LLMは視覚的または聴覚的な情報だけでなく、嗅覚的な情報も処理できるはずです。

[📰 原文はこちら](https://arxiv.org/abs/2604.00002)

---

※本記事はAI（Ollama）による自動翻訳・要約です。

BittensorManがお勧めするメーカーリスト
https://exbridge.jp/xdirect/

AI時代の技術と知識のまとめ(AI生成メディア) - AIDexx
https://exbridge.jp/aidexx/

頑張って働く人に向けて、プロ用仕事アイテムを格安でネット販売しているX-Direct（ https://exdirect.net ）を、BittensorManは応援しています。

動画の最後にお得な情報がありますので、
最後までご覧ください。

Web3 x AI x SNS - AIKnowledgeCMS blog

ページ

2026年4月2日木曜日

大規模言語モデルの嗅覚認識能力評価のためのベンチマーク

「出口をいくら弄っても黒字にならない」ボットの本丸は特徴量だった ― FreqAIに3本目の相関ペアを足したら赤字が黒字に反転した話 07-16

アーカイブ