ページ

2026年2月2日月曜日

感情認識において注意メカニズムだけでは不十分:EAVデータセットでドメイン固有特徴がTransformerを上回る

#aidexx #news

2026年02月02日


## 要約:
感情認識において、EAVデータセットのような小規模データセットでは、複雑な注意メカニズムよりもドメイン知識に基づいた工夫が有効であることが示された。Transformerベースのモデルと比較して、ドメイン固有の特性を追加することで、精度が向上した。本研究は、小規模データセットにおける感情認識において、アーキテクチャの複雑さよりもドメイン知識の活用が重要であることを強調している。

---

## 翻訳:
arXiv:2601.22161v1 公布タイプ: 新規
要旨: 本研究では、EAVデータセットを用いて、複雑な注意メカニズムが小規模データセットでの性能向上に寄与するかどうかを調査する体系的な多様体感情認識の研究を発表します。Transformerベースのモデル(M1)、新しい因子化された注意メカニズム(M2)、および改良されたCNNベースライン(M3)の3つのモデルカテゴリを実装します。実験の結果、高度な注意メカニズムは小規模データセットで一貫して性能が低下することが示されました。M2モデルは、過学習と事前学習された特徴の破壊により、ベースラインと比較して5〜13パーセントポイント低い結果となりました。対照的に、ドメインに適した単純な修正が効果的であることが証明されました。音声CNNにデルタMFCCを追加することで、精度は61.9%から extbf{65.56%}(+3.66pp)に向上し、EEGには周波数領域特徴を追加することで extbf{67.62%}(ペーパーベースラインより+7.62pp)を達成しました。当社のビジョンTransformerベースライン(M1)は extbf{75.30%}に到達し、ドメイン固有の事前学習を通じて、ペーパーのViViT結果(74.5%)を上回りました。ビジョンデルタ特徴は extbf{72.68%}を達成し、ペーパーCNNよりも+1.28pp改善されました。これらの結果は、小規模な感情認識において、ドメイン知識と適切な実装がアーキテクチャの複雑さを上回ることを示しています。

[📰 原文はこちら](https://arxiv.org/abs/2601.22161)

---

※本記事はAI(Ollama)による自動翻訳・要約です。

BittensorManがお勧めするメーカーリスト
https://exbridge.jp/xdirect/

AI時代の技術と知識のまとめ(AI生成メディア) - AIDexx
https://exbridge.jp/aidexx/

頑張って働く人に向けて、プロ用仕事アイテムを格安でネット販売しているX-Direct( https://exdirect.net )を、BittensorManは応援しています。

動画の最後にお得な情報がありますので、
最後までご覧ください。