2026年01月27日
## 要約:
本研究では、LLMの数学的推論能力向上のために、難易度を細かく制御できる高品質なデータ合成手法「MathMixup」を提案します。自動チェックと手動審査を組み合わせ、段階的な難易度で構成されたMathMixupQAデータセットを構築しました。実験の結果、MathMixupとカリキュラム学習戦略は、LLMの数学的推論性能を大幅に向上させることが示されました。
---
## 翻訳:
arXiv:2601.17006v1 Announce Type: new
Abstract: 数学的推論タスクにおいて、大規模言語モデル(LLM)の進歩は、明確に定義され、適切に段階付けされた難易度を持つ高品質なトレーニングデータに大きく依存しています。しかし、既存のデータ合成方法は、多様性の限界や問題の難易度に対する正確な制御の欠如に悩まされ、カリキュラム学習などの効率的なトレーニングパラダイムをサポートするには不十分です。これらの課題に対処するため、私たちは、ハイブリッドおよび分解戦略を通じて、高品質で難易度を制御できる数学的推論問題を体系的に生成する、新しいデータ合成パラダイムであるMathMixupを提案します。意味的な明瞭さと、合成されたデータ内の適切に構造化された難易度勾配を確保するために、自動的な自己チェックと手動スクリーニングが組み込まれています。これに基づいて、私たちはMathMixupQAデータセットを構築し、これらの段階的な問題を活用するカリキュラム学習戦略を設計し、他のデータセットとの柔軟な統合をサポートします。実験結果は、MathMixupとカリキュラム学習戦略が、LLMの数学的推論性能を著しく向上させることを示しています。ファインチューニングされたQwen2.5-7Bは、7つの数学的ベンチマークで平均52.6%のスコアを達成し、以前の最先端の方法を上回っています。これらの結果は、LLMの数学的推論能力を改善し、データ中心のカリキュラム学習を進歩させるためのMathMixupの有効性と幅広い適用性を十分に検証しています。
[📰 原文はこちら](https://arxiv.org/abs/2601.17006)
---
※本記事はAI(Ollama)による自動翻訳・要約です。
BittensorManがお勧めするメーカーリスト
https://exbridge.jp/xdirect/
AI時代の技術と知識のまとめ(AI生成メディア) - AIDexx
https://exbridge.jp/aidexx/
頑張って働く人に向けて、プロ用仕事アイテムを格安でネット販売しているX-Direct( https://exdirect.net )を、BittensorManは応援しています。
動画の最後にお得な情報がありますので、
最後までご覧ください。