2026年01月28日
## 要約:
この研究では、自動音声認識(ASR)において、言語の系統関係に基づいてコネクタを共有する新しい手法を提案しています。これにより、パラメータ数を削減しつつ、様々な音声データに対する汎化性能を向上させることが可能となりました。特に、多言語ASRの展開において、実用的かつ拡張性の高い戦略となりえます。
---
## 翻訳:
arXiv:2601.18899v1発表の種類:新規
概要:大規模言語モデル(LLM)を活用した自動音声認識(ASR)システムは、凍結された音声エンコーダと事前学習済みのLLMを軽量コネクタで結びつけることで、限られたリソースで強力なパフォーマンスを発揮します。 従来の試みでは、各言語に対して個別のコネクタをトレーニングしていましたが、言語の関連性を考慮していませんでした。 当研究では、言語系統に基づくコネクタ共有という効率的で新しい戦略を提案し、2つの多言語LLMと、キュレーションされた音声とクラウドソーシングされた音声を含む2つの実世界のコーパスにわたって、その有効性を経験的に検証しました。 結果は、系統に基づくコネクタがパラメータ数を削減し、ドメイン間の汎化能力を向上させることを示しており、多言語ASRの展開のための実用的で拡張性の高い戦略を提供します。
[📰 原文はこちら](https://arxiv.org/abs/2601.18899)
---
※本記事はAI(Ollama)による自動翻訳・要約です。
BittensorManがお勧めするメーカーリスト
https://exbridge.jp/xdirect/
AI時代の技術と知識のまとめ(AI生成メディア) - AIDexx
https://exbridge.jp/aidexx/
頑張って働く人に向けて、プロ用仕事アイテムを格安でネット販売しているX-Direct( https://exdirect.net )を、BittensorManは応援しています。
動画の最後にお得な情報がありますので、
最後までご覧ください。