ページ

2026年5月25日月曜日

リソース不足のオープンソースText-to-SQLモデルにおける知識蒸留

#aidexx #news

2026年05月25日




## 要約:
本研究は、データが少ない状況でもText-to-SQLモデルの性能を向上させるためのフレームワークを提案しています。スキーマ意味、略語、ビジネスロジックなどの知識ベースを構築し、学習と推論に注入することで、高品質な合成訓練データを作成し、精度向上を図りました。実験結果から、多様なベンチマークにおいて、既存モデルの性能を大幅に改善できることが示されました。

---

## 翻訳:
arXiv:2605.22843v1 新着発表の種類:新規
概要:Text-to-SQLは、自然言語の質問をSQLクエリに変換することで、技術的な知識がないユーザーがリレーショナルデータベースを分析やインテリジェントデータサービスのために利用できるようにします。現実のシナリオでは、高品質なアノテーション付きペアが乏しい、リソース不足な状況に性能が制限されることがよくあります。特にドメイン固有のデータベースにおいては、この傾向が顕著です。さらに、曖昧なスキーマ定義、略語、スキーマに明示的にコード化されていない暗黙のビジネスロジックが課題となります。既存のデータ合成とプロンプト技術はカバレッジを改善しますが、多くの場合、データベースの制約と整合性のあるタスク固有のセマンティックに根差した例を生成することに失敗します。これらの課題に対処するため、タスク固有の知識ベースを構築し、スキーマ意味、略語、ビジネスロジック、クエリパターンを含み、学習と推論の両方に注入する、知識アウェアText-to-SQLフレームワークを提案します。このフレームワークは、多様で文脈に沿った合成トレーニングデータを作成し、ターゲットを絞った知識検索を通じて推論を強化します。7つのベンチマークにおける実験(一般データセットとドメイン固有データセットの両方を含む)により、当社のアプローチは、特にリソースが限られたドメイン固有の設定において、Text-to-SQLタスクにおけるオープンソースおよびクローズドソースの大規模言語モデルの性能を大幅に向上させ、汎化能力、堅牢性、適応性を高めることが示されています。

[📰 原文はこちら](https://arxiv.org/abs/2605.22843)

---

※本記事はAI(Ollama)による自動翻訳・要約です。

BittensorManがお勧めするメーカーリスト
https://exbridge.jp/xdirect/

AI時代の技術と知識のまとめ(AI生成メディア) - AIDexx
https://exbridge.jp/aidexx/

頑張って働く人に向けて、プロ用仕事アイテムを格安でネット販売しているX-Direct( https://exdirect.net )を、BittensorManは応援しています。

動画の最後にお得な情報がありますので、
最後までご覧ください。

コナンコラボ プリキュア側が依頼

#aidexx #news 2026年05月25日 5/25(月) 13:16 オリコン プリキュア側からコナンにオファー 異例コラボ放送は制作に苦労「ハードな調整はご想像にお任せします(笑)」 アニメ『名探偵プリキュア!』(ABCテレビ・テレビ朝日系 毎週日曜午前8時3...