HDC 2026 タイムライン · 7大コンポーネント · NVIDIA非依存訓練 · 競合マトリクス · 6ステップ Runbook
2026年6月30日、Huaweiは HDC 2026 の約束を果たし、openPangu-2.0-Flash の重み、推論コード、訓練・推論オペレータを GitCode に正式公開しました。オープンソースPangu 2.0、Ascend大規模モデル、または国産化コンプライアンス選定に関心がある方に向け、本記事は公式発表と調査資料に基づき、HDC タイムライン、Pro/Flash デュアル版パラメータ、7大オープンソースコンポーネントロードマップ、mHC/ModAttn/DSA+SWA アーキテクチャ解説、世界初のNVIDIA非依存最先端訓練、DeepSeek/Qwen/Kimi 競合マトリクス、ModelArts API + GitCode 自デプロイ6ステップ Runbook、HarmonyOS Agent 戦略的意義、FAQ を提供します。クロスプラットフォーム Agent 開発では、iOS 側のより安定したホストとして Mac Mini M4 月額レンタルが依然有効である理由も説明します。
余承東氏は HDC 2026(2026年6月12日、東莞松山湖)で openPangu 2.0 を正式発表し、6月30日に Flash 版が先行オープンソース化されました。多くの議論は「また一つの国産大規模モデル」に留まっています。以下の盲点はデプロイと調達判断に直接影響します。
オープンソース=「重みのみ」と混同する:業界標準は重み+推論のみの公開です。openPangu 2.0 は事前学習・事後学習コードと Ascend 訓練オペレータの公開を計画しており、超大規模 MoE では極めて稀なフルスタックオープンソースです。
「NVIDIA非依存」の歴史的意義を見落とす:DeepSeek、Qwen、Kimi、Llama はいずれも NVIDIA で訓練されています。openPangu 2.0 は全工程 Ascend 910B で、NVIDIA 非依存ハードウェア上で最先端規模の訓練を完了しオープンソース化した世界初のモデルです。
総合能力ランキングで 512K の価値を否定する:コードと複雑推論では DeepSeek V4 Pro が依然優位ですが、512K コンテキストは openPangu の差別化の切り札です。長編小説8冊分相当のテキスト量に相当します。
Flash と Pro の公開スケジュールを混同する:Flash(92B/6B アクティブ)は公開済み。Pro(505B/18B アクティブ)重みは 2026年7月 予定。事前学習/事後学習コードは2026年後半に段階公開されます。
モデルのみデプロイしホストを計画しない:Ascend スタックは torch_npu、HarmonyOS 端末は Embedded 経路です。Agent が Xcode、Claude Code、OpenClaw も必要なら、モデルは Ascend、ツールチェーンは macOS——マルチモデルルーティング Gateway と同様のレイヤー分割アーキテクチャです。
| 日時 | イベント |
|---|---|
| 2026-06-12 | HDC 2026 余承東氏基調講演で openPangu 2.0 正式発表 |
| 2026-06-30 | Flash 重み、基本推論コード、訓練・推論オペレータを GitCode に公開 |
| 2026-07(予定) | Pro モデル重みと推論コードを公開 |
| 2026年後半(予定) | 事前学習コード、事後学習コード、追加訓練オペレータを順次公開 |
| 指標 | openPangu 2.0 Pro | openPangu 2.0 Flash |
|---|---|---|
| 総パラメータ数 | 505B | 92B |
| アクティブパラメータ数 | 18B | 6B |
| スパース比 | ~28:1 | ~15:1(Flash 版 DSA+SWA で極限スパース化可能) |
| コンテキストウィンドウ | 512K | 512K |
| 利用可能状態 | 7月公開予定 | 2026-06-30 公開済み |
| コンポーネント | 状態 |
|---|---|
| モデル構造(アーキテクチャ定義) | 公開済み |
| モデル重み(Flash) | 2026-06-30 公開 |
| 技術レポート | 重みと同時公開 |
| 推論コード + 訓練・推論オペレータ | 2026-06-30 公開 |
| モデル重み(Pro) | 2026-07 予定 |
| 事前学習コード | 2026年後半予定 |
| 事後学習コード(SFT/RLHF) | 2026年後半予定 |
最初の4項目は業界オープンソースの定番です。事前学習コード、事後学習コード、Ascend 訓練オペレータは超大規模 MoE では極めて稀——研究者と企業がゼロから最先端モデルを再現できます。
オープンソースライセンスは Huawei openPangu License:商用利用可、ロイヤリティフリー、非独占。詳細は GitCode Ascend Tribe リポジトリをご確認ください。
openPangu 2.0 はNVIDIA 非依存ハードウェア上で全規模訓練を完了した最先端大規模モデルの初事例です。全工程 Huawei Ascend 910B NPU、A100/H100 は不使用。
import torch_npu で Ascend バックエンドに切替独立第三者ベンチマークは現在評価中です。下記能力マトリクスはアーキテクチャ推論に基づくもので、実測スコアではありません。結果公開後に本記事を更新します。
| モデル | 総パラメータ | アクティブ | コンテキスト | 訓練ハードウェア | オープンソース度 |
|---|---|---|---|---|---|
| openPangu 2.0 Pro | 505B | 18B | 512K | Ascend NPU | フルスタック(7コンポーネント) |
| openPangu 2.0 Flash | 92B | 6B | 512K | Ascend NPU | フルスタック(7コンポーネント) |
| DeepSeek V4 Pro | 1.6T | ~200B | 128K | NVIDIA | 重み+推論 |
| Qwen 3.7 Max | ~400B+ | 可変 | 128K | NVIDIA | 重み+推論+一部訓練 |
| Kimi K2.7 | 1T | 32B | 256K | NVIDIA | 重み+推論 |
| Llama 4 405B | 405B | — | 128K | NVIDIA | 重み+推論 |
| 能力次元 | openPangu 2.0 Pro | DeepSeek V4 Pro | Qwen 3.7 Max | Kimi K2.7 |
|---|---|---|---|---|
| コード生成 | ★★★ | ★★★★★ | ★★★★ | ★★★★ |
| 複雑推論 | ★★★ | ★★★★★ | ★★★★★ | ★★★★ |
| ツール呼び出し/Agent | ★★★★ | ★★★★ | ★★★★ | ★★★★★ |
| 超長コンテキスト | ★★★★★ | ★★★ | ★★★ | ★★★★ |
| 推論効率 | ★★★★★ | ★★ | ★★ | ★★★★ |
| 技術的主権 | ★★★★★ | ★ | ★ | ★ |
| フルスタックオープンソース | ★★★★★ | ★★★ | ★★★ | ★★★ |
| シーン | 推奨 | 理由 |
|---|---|---|
| コード生成 / 複雑推論 | DeepSeek V4 Pro | ~200B アクティブ、性能リード |
| Agent / マルチツール協調 | Kimi K2.7 | MCP エコシステムが充実 |
| 超長文書(>256K Token) | openPangu 2.0 Pro | 512K コンテキストの第一選択 |
| 国産化 / コンプライアンス / NVIDIA非依存 | openPangu 2.0 | 純国産ハードウェア訓練の唯一の最先端モデル |
| Ascend / Huawei Cloud デプロイ | openPangu 2.0 | ネイティブ最適化、スループット2倍 |
| 端末 / スマートフォンデプロイ | openPangu Embedded | 30B 端末、麒麟オフライン |
| 低コストローカル推論 | openPangu 2.0 Flash | 6B アクティブ、~96GB で実行可能 |
| バージョン | 推奨ハードウェア | 最低構成 | 備考 |
|---|---|---|---|
| Flash(6B アクティブ) | 単一カード Ascend 910B | ~96GB 統一メモリ | 大容量メモリシステムでコミュニティテスト可能 |
| Flash-Int8 | 単一カード Atlas A2 | ~48GB メモリ | W4A8、精度損失 <10% |
| Pro(18B アクティブ) | 4+ 枚 Ascend 910B | マルチカードクラスタ | 7月重み公開後に検証 |
パス選択:ハードウェアがない場合は ModelArts API を優先(Huawei Cloud 登録 → AI Gallery → openPangu 2.0 検索 → Flash/Pro 購読)。Ascend クラスタがある場合は GitCode 自デプロイ。
リポジトリ取得:gitcode.com/org/ascend-tribe にアクセスし、openPangu-2.0-Flash、openPangu-2.0-Infer、openPangu-2.0-Op(オペレータ)をクローン。
CANN + torch_npu 設定:Ascend ドライバと CANN をインストール。PyTorch プロジェクトに import torch_npu を追加してバックエンド切替。
Flash 単一カード推論:910B 上で推論スクリプトを実行、--context_length 512000 で長コンテキストを検証(メモリに応じて調整)。
量子化または分散:メモリ不足時は openPangu-2.0-Flash-Int8。Pro 版はマルチカード distributed_inference.py(7月重み後)。
ドメイン微調整(任意):LoRA 例 finetune.py --method lora --lora_rank 16。事前学習コードは後半オープンソース後に二次事前学習可能。
curl -X POST "https://modelarts.${REGION}.myhuaweicloud.com/v1/infers/openpangu-2-flash/chat/completions" \
-H "Content-Type: application/json" \
-H "X-Auth-Token: ${TOKEN}" \
-d '{
"model": "openpangu-2.0-flash",
"messages": [{"role": "user", "content": "こんにちは、自己紹介をお願いします"}],
"max_tokens": 1024,
"temperature": 0.7
}'
python inference.py \ --model_path ./openPangu-Flash \ --device npu:0 \ --context_length 512000 \ --precision bf16
米国の A100/H100 対中輸出規制の背景下で、openPangu 2.0 はNVIDIA なしでも最先端 MoE を訓練できることを証明しました。これは技術的成果にとどまらず、「CUDA 独占」というナラティブへの有力な応答です。余承東氏は HDC 2026 で「私の残りの人生の辞書に、第二はない。第一だけだ」と述べました。
フルスタックオープンソースにより、学術研究は訓練を再現でき、企業は垂直領域の二次事前学習が可能になり、開発者は Ascend 算力のハードルを下げられます。HarmonyOS 7 は Agent 時代に全面突入し、openPangu 2.0 はネイティブ AI エンジンです。端末 30B モデルは麒麟スマートフォンでオフライン実行できます。
openPangu 2.0 は総合能力で DeepSeek V4 Pro を必ずしも上回りませんが、512K コンテキスト、国産化、Ascend ネイティブ、フルスタックオープンソース、端末適配の5次元ではほぼ代替不可です。スタックが HarmonyOS Agent + iOS/Xcode CI + OpenClaw マルチモデルルーティング をカバーする場合、Ascend で推論、macOS でツールチェーンという現実的分業が生じます。ノート PC を閉じると深夜タスクが失われ、Linux VPS には Metal と Keychain がありません。VpsMesh Mac Mini M4 クラウドレンタルは 7×24 uptime とネイティブ Apple ツールチェーンを月額 OpEx にパッケージ化します。プランは Mac Mini M4 レンタル料金、デプロイは ヘルプセンターをご覧ください。
免責事項:一部ベンチマークはアーキテクチャ推論評価です。独立第三者の結果公開後に継続更新します。公開日:2026年7月1日。
Flash(92B/6B アクティブ)は6月30日公開済み、910B 単一カードで推論可能、高並行 API に適しています。Pro(505B/18B アクティブ)は7月公開予定、512K 長文書と二次事前学習の第一選択です。重みは GitCode Ascend Tribe をご確認ください。
コードと複雑推論は DeepSeek V4 Pro(~200B アクティブ)を選択。512K コンテキスト、国産化コンプライアンス、Ascend 2倍スループット、フルスタック訓練コードは openPangu 2.0 を選択。マルチモデル併存は OpenClaw マルチモデルルーティング を参照してください。
純粋な Ascend/ModelArts のみなら不要です。スタックに Xcode、Claude Code、OpenClaw デーモンがある場合は Mac Mini M4 月額レンタルがより安定します。プランは Mac Mini M4 レンタル料金、申込は 注文ページです。