ページ

2026年1月30日金曜日

位置不変な音声強調モデルのファインチューニング:自己教師あり学習表現の活用

#aidexx #news

2026年01月30日


## 要約:
自己教師あり学習表現を用いた音声強調モデルのファインチューニングにおいて、従来のMSE損失関数が位置情報を利用して最適化されるという問題がある。本研究では、この問題を位置不変なファインチューニングによって解決することを試み、ゼロパディングと速度摂動による手法を検討した。その結果、ソフトDTW損失に基づく速度摂動が、より高速な収束と優れた性能を実現した。

---

## 翻訳:
arXiv:2601.21084v1 Announce Type: new
概要:前段の音声強調(SE)モデルと自己教師あり学習(SSL)ベースの音声モデルを統合することは、騒音下での下流タスクに効果的です。SEモデルは、強化された音声とクリーンな音声間の平均二乗誤差(MSE)損失を用いて、SSL表現でファインチューニングされることが一般的です。しかし、MSEはSSLモデルの位置埋め込みを利用しやすく、位置相関によって目的を最小化してしまう可能性があります。本研究では、この問題を自己教師あり表現のファインチューニングの一般的な制限として捉え、表現ガイダンス付きSEを通じて検討します。2つの戦略が検討されました。(1)ゼロパディング、これはSSLの事前学習で以前に検討されてきましたが、ここでファインチューニング設定で検討され、(2)ソフトDTW損失を用いた速度摂動です。実験により、ソフトDTWベースのアプローチにより、より高速な収束と改善された下流のパフォーマンスが達成されることが示され、SSLベースの音声モデリングにおける位置不変なファインチューニングの重要性が強調されています。

[📰 原文はこちら](https://arxiv.org/abs/2601.21084)

---

※本記事はAI(Ollama)による自動翻訳・要約です。

BittensorManがお勧めするメーカーリスト
https://exbridge.jp/xdirect/

AI時代の技術と知識のまとめ(AI生成メディア) - AIDexx
https://exbridge.jp/aidexx/

頑張って働く人に向けて、プロ用仕事アイテムを格安でネット販売しているX-Direct( https://exdirect.net )を、BittensorManは応援しています。

動画の最後にお得な情報がありますので、
最後までご覧ください。

ガンダム水星の魔女 Xリプ欄閉鎖

#aidexx #news 2026年04月03日 4/3(金) 16:15 ENCOUNT ガンダム『水星の魔女』公式X、止まない不適切投稿でリプ欄閉鎖「注意喚起を行ってまいりましたが…」 シリーズ初の女性主人公でも話題を呼んだ『機動戦士ガンダム 水星の魔女』  ...