本記事はHorizonを使いAI/LLM・バイブコーディング・Web3・スタートアップのニュースを自動収集・要約したものです。

Deepseek V4 FlashとDGX Sparks：ローカルLLMの処理速度競争が激化

AIのインフラストラクチャとWeb3の金融化が交差する今、AIモデルの「どこで」「どれだけ速く」動かせるかが最大の焦点となっています。今週のニュースは、高性能なハードウェアベンチマークから、検閲に強いローカルなAI環境の構築、さらにはトークン化された金融市場の動向まで、多岐にわたる最前線の動きを捉えています。

🚀 AIインフラの最前線：ローカルLLMの性能向上

今週の注目点は、大規模言語モデル（LLM）を動かすハードウェアの進化と、分散化された環境でのモデル利用のしやすさです。

1. Dual DGX SparksによるLLM推論速度の飛躍的向上

複数のDGX Sparksを組み合わせることで、大規模なMoE（Mixture of Experts）モデルの推論速度が劇的に向上することが示されました。特に、Deepseek V4 Flashなどのモデルにおいて、複数のユニットを連携させることで、単体機や一般のプロシューマー向けハードウェアを大きく凌ぐ高い処理速度（最大350トークン/秒など）を達成できることがベンチマークを通じて実証されています。

2. XiaomiがMiMo V2.5の性能を大幅にブースト

Xiaomiは、DFlashモデルとPersistentカーネルを活用し、MiMo V2.5のサービス提供性能を1000〜3000トランザクション/秒というレベルまで向上させました。この最適化は、DFlashモデルのオープンソース化が間近に迫っていることを示唆しており、より多くの開発者が高性能なローカルLLM環境にアクセスしやすくなることを意味します。

3. 検閲に強い「Heretic Grimoire」による分散型バックアップの提案

AIモデルの利用環境が特定のプラットフォームに依存するリスクが高まる中、「Heretic Grimoire」というプロジェクトが、プラットフォームの強制的な停止や検閲に耐性を持つ、分散型のバックアップシステムを立ち上げました。これは、ユーザーが特定の権威に依存せず、自由にモデルを利用し続けるための「ローカルファースト」なアプローチを強く支持する動きです。

🌐 Web3と金融市場の動向：トークン化の加速

AIの進化と並行して、Web3分野では現実世界の資産をデジタル化し、金融市場に組み込む「トークン化」の動きが加速しています。

4. トークン化市場の急拡大とウォールストリートの接近

トークン化された資産市場が146億ドルという規模に達し、伝統的なウォールストリートと暗号資産（クリプト）市場が急速に融合しています。この流れは、現実世界の金融資産がブロックチェーン上でデジタルアセットとして扱われる時代が到来しつつあることを示しています。

5. MetaのLLM開発戦略の転換の可能性

Metaが、社内での大規模言語モデル（LLM）開発から徐々に手を引き、関連するエンジニアやリソースを他の分野に再配置している可能性が指摘されています。これは、AI開発の焦点が「巨大な自社開発」から「外部連携やプラットフォーム化」へとシフトしている可能性を示唆しています。

6. SECによるトークン化パスの規制の課題

SEC（米国証券取引委員会）がトークン化の道筋を明確にしようと大きな動きを見せていますが、専門家からは、この動きが完全なルール作りや市場のレジリエンス（回復力）を確保するには不十分であるという分析が出ています。規制当局の動きは注目されますが、まだ不確実性が残る状況です。

Web3 x AI x SNS - AIKnowledgeCMS blog

ページ

2026年6月15日月曜日

Theで読む：Deepseek V4 FlashとDGX Sparks：ローカルLLMの処理速度競争が激化 06-15