2026年04月02日

## 要約:
本研究では、大規模言語モデルのオンライン微調整において、サンプルデータの有用性を評価するために、最適化器の状態を考慮したデータ選択手法を提案しています。この手法は、まず有用な候補データを絞り込み、次にそれらの係数を最適化する二段階フィルタリング・重み付けアルゴリズムです。実験の結果、既存の手法と比較して、収束速度と性能が向上することが確認されました。
---
## 翻訳:
arXiv:2604.00001v1を発表 Type: new
概要:勾配ベースのデータ選択は、大規模言語モデル(LLM)の微調整におけるサンプル有用性の評価のための原則的な枠組みを提供しますが、既存の方法は主にオフライン設定向けです。したがって、データが逐次的に到着し、サンプル有用性がステップ依存性であり、適応的最適化器によって効果的な更新幾何学が形作られるオンライン微調整には適していません。私たちは、LLMの微調整における勾配ベースのオンラインデータ選択と重み付けのための最適化器を意識したフレームワークを提案します。私たちの主要なアイデアは、オンライン選択を静的なサンプルランキングではなく、最適化器の状態の下で次のターゲット指向の更新を形作るものとして捉えることです。これを最適化器を意識した更新マッチング問題として定式化し、2次ターゲット有用性との関連性を確立し、選択されたサンプルの相互作用と冗長性を考慮してサブセットレベルの構築が必要である理由を示します。この視点に基づいて、幾何的に有用な候補を最初にフィルタリングし、次にそれらの係数を最適化する2段階のFilter-then-Weightアルゴリズムを開発しました。このフレームワークをLLMで実用的に使用するために、長文データ用の因子化された外積勾配表現と最適化された行列計算を導入しました。実験から、同じデータ予算のもとで、私たちの方法は既存のオンラインデータ選択のベースラインよりも収束と下流のパフォーマンスを常に向上させることが示されています。
[📰 原文はこちら](https://arxiv.org/abs/2604.00001)
---
※本記事はAI(Ollama)による自動翻訳・要約です。
BittensorManがお勧めするメーカーリスト
https://exbridge.jp/xdirect/
AI時代の技術と知識のまとめ(AI生成メディア) - AIDexx
https://exbridge.jp/aidexx/
頑張って働く人に向けて、プロ用仕事アイテムを格安でネット販売しているX-Direct( https://exdirect.net )を、BittensorManは応援しています。
動画の最後にお得な情報がありますので、
最後までご覧ください。