
## 要約:
文法誤り訂正システムに多様な引用文を導入し、モデルの性能向上と評価の精度を高めるために、編集レベルの有効性を評価する自動化フレームワークJELVを開発した。
---
## 翻訳:
既存の文法誤り訂正(GEC)システムは引用多様性が限られているため、評価が過小評価され、モデルの汎用性も制約されます。これを解決するため、編集レベルの文法的妥当性、忠実性、流暢性に基づく補正編集を検証するための自動化されたフレームワークであるJudge of Edit-Level Validity(JELV)を開発しました。PEVDataという提案による人間注釈済みペア編集レベル有効性データセットを使用して、90%の一致率を達成した多段階LLM-as-Judgesパイプラインと、85%の精度を持つ簡潔化されたDeBERTa分類器の2つの実装を提供しました。JELVを用いて評価で誤った正解を再分類し、不正確な肯定事項の分離と流暢性スコアリングを統合して総合的な評価指標を作成することで、人間の判断と高い相関を示すことができました。また、LLM生成の補正候補をフィルタリングすることで、BEA19データセットの単一参照から38,692文の多様な引用文を拡張しました。この拡張されたデータセットでトップGECシステムを再訓練すると、測定可能なパフォーマンス向上が見られました。
[📰 原文はこちら](https://arxiv.org/abs/2511.21700)
---
※本記事はAI(Ollama)による自動翻訳・要約です。
頑張って働く人に向けて、プロ用仕事アイテムを格安でネット販売しているX-Direct( https://exdirect.net )を、BittensorManは応援しています。
BittensorManがお勧めするメーカーリスト
http://exbridge.jp/xdirect/
動画の最後にお得な情報がありますので、
最後までご覧ください。