ページ

2026年4月1日水曜日

CrossTrace:仮説生成のための、ドメイン横断的な根拠に基づいた科学的推論追跡データセット

#aidexx #news

2026年04月01日




## 要約:
この論文では、科学研究の仮説生成を支援する新しいデータセット「CrossTrace」を発表しています。生体医学、AI/ML、そしてそれらの融合領域を網羅し、既存のデータセットが抱えていた単一ドメインの制約と明示的な推論追跡の欠如を克服しています。CrossTraceは、Qwen2.5-7B-Instructの性能向上に大きく貢献しており、科学的推論パターンのドメイン横断的な伝播を示しています。

---

## 翻訳:
arXiv:2603.28924v1 で発表された内容です。科学的仮説の生成は研究を加速する上で重要なボトルネックですが、仮説生成モデルを訓練および評価するための既存のデータセットは、単一のドメインに限定され、先行知識から斬新な貢献へのつながりを明確にする推論追跡が不足しています。ここでは、生体医学(518)、AI/ML(605)、およびクロスドメインワーク(266)にまたがる1,389の根拠に基づいた科学的推論追跡のデータセットであるCrossTraceを紹介します。各追跡は、確立された知識から中間的な論理ステップを経て新しい仮説へとつながる構造化された推論チェーンを捉え、すべてのステップがソース論文のテキストに根拠を持っています。Input/Trace/Outputスキーマを定義し、HypoGenのBit-Flip-Sparkフレームワークをステップレベルの検証、8つの発見パターンの分類法、およびマルチドメインカバレッジで拡張しました。QLoRAを介してCrossTraceでQwen2.5-7B-Instructをファインチューニングすることで、調整されていないベースラインを大幅に改善しました。IAScoreはGPT-4o審査員によって0.828から0.968へ、Claude Opus 4.5によって0.716から0.888へ上昇し、構造的コンプライアンスは0%から100%へ改善され、スパークコサイン類似度は0.221から0.620へ増加しました。バランスの取れたドメイン横断的な訓練(生体医学 + AI/ML + CS)は、単一ドメインの訓練よりも優れており、科学的推論パターンが学問分野にわたって伝播するという証拠を提供します。150件の層化された記録の人間による検証は、ステップレベルの根拠の精度が99.7%で、捏造率が0.0%であることを確認しました。CrossTraceは、ステップレベルで根拠のある推論追跡を持つ大規模なドメイン横断データセットとして初めて登場し、そのような追跡は、少なくとも部分的にドメイン一般的に有効な訓練シグナルであることを結果が示しています。

[📰 原文はこちら](https://arxiv.org/abs/2603.28924)

---

※本記事はAI(Ollama)による自動翻訳・要約です。

BittensorManがお勧めするメーカーリスト
https://exbridge.jp/xdirect/

AI時代の技術と知識のまとめ(AI生成メディア) - AIDexx
https://exbridge.jp/aidexx/

頑張って働く人に向けて、プロ用仕事アイテムを格安でネット販売しているX-Direct( https://exdirect.net )を、BittensorManは応援しています。

動画の最後にお得な情報がありますので、
最後までご覧ください。

ガンダム水星の魔女 Xリプ欄閉鎖

#aidexx #news 2026年04月03日 4/3(金) 16:15 ENCOUNT ガンダム『水星の魔女』公式X、止まない不適切投稿でリプ欄閉鎖「注意喚起を行ってまいりましたが…」 シリーズ初の女性主人公でも話題を呼んだ『機動戦士ガンダム 水星の魔女』  ...