ページ

2026年1月16日金曜日

LLMを活用した発話予測データ合成:人間と機械の対話における次のユーザー発話を予測する

#aidexx #news

2026年01月16日


## 要約:
本研究では、人間と機械の対話において、ユーザーの次の発話を予測する新しい手法「ProUtt」を提案します。ProUttは、LLMを活用して対話履歴を意図の木構造に変換し、意図の推論過程を明示的にモデル化することで、既存のデータ合成手法やシミュレーターを上回る性能を実現しました。コードと合成データセットを公開し、今後の研究を促進します。

---

## 翻訳:
arXiv:2601.09713v1 Announce Type: new
Abstract: 人間と機械の対話において、ユーザーの次の発話を予測することは、インタラクションを効率化し、ユーザーエクスペリエンスを向上させるために重要です。既存の商用APIベースのソリューションはプライバシーに関する懸念があり、汎用LLMをローカルに展開するには計算コストがかかります。したがって、コンパクトでタスク固有のLLMをトレーニングすることが実用的な代替手段となります。ユーザーシミュレーターメソッドはユーザーの次の発話を予測できますが、主に彼らの話し方を模倣するだけで、対話を前進させるものではありません。積極的な次の発話予測を支援し、LLMをユーザーの好みに合わせるために、嗜好データ合成が調査されてきました。しかし、既存の方法は、ユーザーの次の発話につながる意図推論を明示的にモデル化し、ユーザーの次の発話を予測するための嗜好および非嗜好推論プロセスを定義および合成する能力がありません。これらの課題に対処するために、積極的な次の発話予測のためのLLM駆動嗜好データ合成メソッドであるProUttを提案します。ProUttは対話履歴を意図の木に変換し、搾取と探査の両方の観点から次の実行可能なパスを予測することで、意図推論の軌跡を明示的にモデル化します。次に、異なる将来のターンで意図の木パスを摂動または修正することで、嗜好および非嗜好推論プロセスを構築します。LLMを評価者として使用し、人間による評価を使用した広範な評価により、ProUttは4つのベンチマークデータセットにわたって既存のデータ合成メソッド、ユーザーシミュレーター、商用LLM APIよりも一貫して優れた性能を発揮することが示されました。コードと合成データセットの両方を公開し、将来の研究を促進します。

[📰 原文はこちら](https://arxiv.org/abs/2601.09713)

---

※本記事はAI(Ollama)による自動翻訳・要約です。

BittensorManがお勧めするメーカーリスト
https://exbridge.jp/xdirect/

AI時代の技術と知識のまとめ(AI生成メディア) - AIDexx
https://exbridge.jp/aidexx/

頑張って働く人に向けて、プロ用仕事アイテムを格安でネット販売しているX-Direct( https://exdirect.net )を、BittensorManは応援しています。

動画の最後にお得な情報がありますので、
最後までご覧ください。

3分で片付く!仕事前のデスク整理術

#aidexx #生活習慣 #knowhow 【保存版】 3分で片付く!仕事前のデスク整理術 1. まずはデスクの物を全て引き出しや棚に移動させる。 2. 次に、3分間でペン、クリップ、メモ帳など使用頻度の高い物を整理する。 3. デスクマットの上で5つ...