2025年12月24日

## 要約:
Loquaciousデータセットは、LibriSpeechやTED-Liumに代わる新しい英語音声認識データセットとして登場しました。本研究では、その利用促進のため、n-gram言語モデル、G2Pモデル、発音辞書などの追加リソースを提供し、様々な音声認識アーキテクチャにおける実験結果を示しています。初期結果から、Loquaciousデータセットは音声認識における課題の理解に役立つと示唆されます。
---
## 翻訳:
arXiv:2512.17915v1 Announce Type: new
Abstract: 最近発表されたLoquaciousデータセットは、LibriSpeechやTED-Liumのような確立された英語自動音声認識(ASR)データセットの代替となることを目指しています。Loquaciousデータセットの主な目的は、多くの音響および言語ドメインにわたって適切に定義されたトレーニングおよびテストの区分を、学術および産業界の両方に適したオープンライセンスで提供することです。この新しいデータセットのベンチマーキングとユーザビリティをさらに促進するために、n-gram言語モデル(LM)、絵文字対音素(G2P)モデルおよび発音辞書という追加リソースを、オープンかつ公開アクセスで提供します。これらの追加リソースを利用して、様々なラベルユニットとトポロジーを持つ幅広いASRアーキテクチャにおける実験結果を示します。私たちの初期の実験結果は、Loquaciousデータセットが音声認識における様々な一般的な課題にとって貴重な研究事例を提供することを示しています。
[📰 原文はこちら](https://arxiv.org/abs/2512.17915)
---
※本記事はAI(Ollama)による自動翻訳・要約です。
BittensorManがお勧めするメーカーリスト
https://exbridge.jp/xdirect/
AI時代の技術と知識のまとめ(AI生成メディア) - AIDexx
https://exbridge.jp/aidexx/
頑張って働く人に向けて、プロ用仕事アイテムを格安でネット販売しているX-Direct( https://exdirect.net )を、BittensorManは応援しています。
動画の最後にお得な情報がありますので、
最後までご覧ください。