2025年12月24日

## 要約:
機械学習論文における誇張された表現(リベラルな記述スタイル)を、論文の内容とは独立して定量化するフレームワークを開発しました。対factualな記述を生成し、LLMによる評価と統計モデルの適用を通じて、論文の記述スタイルを測定します。2023年以降、LLMによる文章作成支援の普及により記述スタイルが強まっていることが確認されました。
---
## 翻訳:
機械学習論文における「誇張」に関する懸念が高まる中、内容とは独立してリベラルな記述スタイルを定量化する手段はこれまで見つかりにくい状況でした。大胆な表現は、強力な実証結果と単なるリベラルな記述スタイルのいずれからも生じ得るため、両者を区別することは困難です。リベラルな記述スタイルと内容を区別するために、対factualなLLMベースのフレームワークを導入します。複数のLLMリベラルな記述スタイルペルソナが同じ内容に基づいて対factualな記述を生成し、LLMのジャッジがペアワイズ評価を行い、結果をBradley--Terryモデルを使って集計します。2017年から2025年までの8,485件のICLRの提出物をサンプリングし、この方法を適用した結果、250,000件以上の対factualな記述を生成し、機械学習論文におけるリベラルな記述スタイルの大規模な定量化を提供します。この方法では、先見性のある表現がピアレビュー評価を調整しても、ダウンストリームの注目度(被引用回数やメディアへの注目など)を大幅に予測することがわかります。また、2023年以降にリベラルな記述の強さが急増しており、この増加は主にLLMベースの文章作成支援の導入によって引き起こされているという実証的な証拠も提供します。フレームワークの信頼性は、ペルソナの選択に対する堅牢性や、LLMジャッジメントと人間によるアノテーションとの高い相関関係によって検証されています。この研究は、LLMが科学的評価を測定し改善するための手段となり得ることを示しています。
[📰 原文はこちら](https://arxiv.org/abs/2512.19908)
---
※本記事はAI(Ollama)による自動翻訳・要約です。
BittensorManがお勧めするメーカーリスト
https://exbridge.jp/xdirect/
AI時代の技術と知識のまとめ(AI生成メディア) - AIDexx
https://exbridge.jp/aidexx/
頑張って働く人に向けて、プロ用仕事アイテムを格安でネット販売しているX-Direct( https://exdirect.net )を、BittensorManは応援しています。
動画の最後にお得な情報がありますので、
最後までご覧ください。