2026年02月26日

## 要約:
本研究では、EQ-5D (健康関連生活の質を評価する標準的なツール) を使用した研究論文を識別するために、BERTやBioBERTなどの事前学習済み言語モデルを、生体医学エンティティ情報で強化し、複数インスタンス学習を組み合わせた。この手法により、従来のベースラインや既存の言語モデルベースラインを大幅に上回り、論文レベルでの再現率を向上させることが可能となった。この結果は、体系的なレビューにおける自動スクリーニングの精度向上に貢献する。
---
## 翻訳:
arXiv:2602.21216v1 Announce Type: new
Abstract: EQ-5D (EuroQol 5-Dimensions) は、健康関連生活の質を評価するための標準的なツールです。健康経済学における体系的な文献レビュー (SLR) は、EQ-5Dを使用する出版物を正しく特定することに依存しますが、大量の科学文献を手動でスクリーニングするには、時間と労力がかかり、間違いが生じやすく、一貫性に欠けます。本研究では、scispaCyモデルを通じて抽出された生体医学エンティティ情報で強化された、汎用的な(BERT)とドメイン固有の(SciBERT, BioBERT)事前学習済み言語モデル(PLM)のファインチューニングを調査し、抄録からのEQ-5D検出を改善することを目的とします。3つのscispaCyモデルと3つのPLMを組み合わせた9つの実験セットアップを実施し、文レベルと研究レベルの両方でその性能を評価しました。さらに、各抄録をscispaCyによって強化された文の集まりとして表現し、文レベル情報を研究レベルの予測に集約するために、注意プーリングを用いた複数インスタンス学習(MIL)アプローチを検討しました。その結果、F1スコアが向上(0.82に達する)し、研究レベルでの再現率がほぼ完璧であることが示され、古典的なボキャブラリーベースラインや最近報告されたPLMベースラインを大幅に上回っています。これらの結果は、エンティティ強化がドメイン適応とモデルの汎化を大幅に改善し、体系的なレビューにおけるより正確な自動スクリーニングを可能にすることを明らかにしています。
[📰 原文はこちら](https://arxiv.org/abs/2602.21216)
---
※本記事はAI(Ollama)による自動翻訳・要約です。
BittensorManがお勧めするメーカーリスト
https://exbridge.jp/xdirect/
AI時代の技術と知識のまとめ(AI生成メディア) - AIDexx
https://exbridge.jp/aidexx/
頑張って働く人に向けて、プロ用仕事アイテムを格安でネット販売しているX-Direct( https://exdirect.net )を、BittensorManは応援しています。
動画の最後にお得な情報がありますので、
最後までご覧ください。