
## 要約:
未標記 Corpus を用いた一般的な取り込み埋め込みモデルから専門的なモデルを訓練することで、金融分野での情報検索性能が向上。
---
## 翻訳:
この論文は、生成型大規模言語モデル(LLM)の進歩にもかかわらず、専門会話AIエージェントの実用化には計算コスト、遅延要件、以及特化した分野向けの正確なドメイン固有性評価尺度が必要であるという課題について述べています。当論文では、未標記 Corpus を使用して一般目的取り込み埋め込みモデルを基礎とし専門モデルを訓練するスケーラブルなパイプラインを導入しています。これは金融分野の14種類のフィリングデータで21,800件のクエリ-ドキュメントペアに対するMRR@5平均27.7%向上と、DCG@5平均44.6%向上、そしてFinanceBenchの3つのドキュメントクラスでのNDCG向上を達成しています。取り込み埋め込み(双方向エンコーダ)をRAGに適用し、LLMによって評価された関連性を使って分野特有の知識をコンパクトなリトリーバーへと引き出す方法も述べています。
[📰 原文はこちら](https://arxiv.org/abs/2512.08088)
---
※本記事はAI(Ollama)による自動翻訳・要約です。
BittensorManがお勧めするメーカーリスト
https://exbridge.jp/xdirect/
AI時代の技術と知識のまとめ - AIDexx
https://exbridge.jp/aidexx/
頑張って働く人に向けて、プロ用仕事アイテムを格安でネット販売しているX-Direct( https://exdirect.net )を、BittensorManは応援しています。
動画の最後にお得な情報がありますので、
最後までご覧ください。