2026年03月27日

## 要約:
システマティックレビューにおけるタイトルとアブストラクトのスクリーニング作業を効率化するため、12億パラメータの言語モデルをファインチューニングした研究が行われた。その結果、ベースモデルと比較して大幅な性能向上が見られ、人間による評価と高い一致率を達成した。この研究は、大規模なシステマティックレビューにおいて言語モデルのファインチューニングが有望であることを示唆している。
---
## 翻訳:
arXiv:2603.24767v1 Announce Type: new
概要:システマティックレビューは、従来から多くの人的時間と労力を要するものであり、その理由の一つは、潜在的な包含のために検討しなければならないタイトルとアブストラクトの数が膨大であることにある。最近、研究者たちは、このプロセスをより効率的にするために大規模言語モデル(LLM)を使用する方法を探り始めた。しかし、これまでの研究では結果がばらつきがあることが示されている。本研究では、プロンプトだけではモデルに必要な十分なコンテキストが提供されないためと考え、人間が潜在的な包含のために8500以上のタイトルとアブストラクトを評価したシステマティックレビューのコンテキストで、12億パラメータのオープンウェイトLLMを特定的にファインチューニングした。その結果、ファインチューニングされたモデルは著しい性能向上を示し、加重F1スコアはベースモデルと比較して80.79%向上した。8,277件の研究のフルデータセットで実行した場合、ファインチューニングされたモデルは人間のコーダーと86.40%の一致率、91.18%の真陽性率、86.38%の真陰性率、そして複数の推論実行にわたる完全な一致率を達成した。これらを総合的に見ると、大規模システマティックレビューにおけるタイトルとアブストラクトのスクリーニングにおいて、LLMのファインチューニングに有望性があることが示されている。
[📰 原文はこちら](https://arxiv.org/abs/2603.24767)
---
※本記事はAI(Ollama)による自動翻訳・要約です。
BittensorManがお勧めするメーカーリスト
https://exbridge.jp/xdirect/
AI時代の技術と知識のまとめ(AI生成メディア) - AIDexx
https://exbridge.jp/aidexx/
頑張って働く人に向けて、プロ用仕事アイテムを格安でネット販売しているX-Direct( https://exdirect.net )を、BittensorManは応援しています。
動画の最後にお得な情報がありますので、
最後までご覧ください。