Huawei openPangu 2.0 オープンソース公開:505B MoE、512Kコンテキスト、Ascendフルスタック解説

HDC 2026 タイムライン · 7大コンポーネント · NVIDIA非依存訓練 · 競合マトリクス · 6ステップ Runbook

Huawei openPangu 2.0 オープンソース大規模言語モデル:Ascend MoE アーキテクチャ

2026年6月30日、Huaweiは HDC 2026 の約束を果たし、openPangu-2.0-Flash の重み、推論コード、訓練・推論オペレータを GitCode に正式公開しました。オープンソースPangu 2.0Ascend大規模モデル、または国産化コンプライアンス選定に関心がある方に向け、本記事は公式発表と調査資料に基づき、HDC タイムラインPro/Flash デュアル版パラメータ7大オープンソースコンポーネントロードマップmHC/ModAttn/DSA+SWA アーキテクチャ解説世界初のNVIDIA非依存最先端訓練DeepSeek/Qwen/Kimi 競合マトリクスModelArts API + GitCode 自デプロイ6ステップ RunbookHarmonyOS Agent 戦略的意義FAQ を提供します。クロスプラットフォーム Agent 開発では、iOS 側のより安定したホストとして Mac Mini M4 月額レンタルが依然有効である理由も説明します。

01

openPangu 2.0 を理解する前に、5つのよくある誤解を解く

余承東氏は HDC 2026(2026年6月12日、東莞松山湖)で openPangu 2.0 を正式発表し、6月30日に Flash 版が先行オープンソース化されました。多くの議論は「また一つの国産大規模モデル」に留まっています。以下の盲点はデプロイと調達判断に直接影響します。

  1. 01

    オープンソース=「重みのみ」と混同する:業界標準は重み+推論のみの公開です。openPangu 2.0 は事前学習・事後学習コードと Ascend 訓練オペレータの公開を計画しており、超大規模 MoE では極めて稀なフルスタックオープンソースです。

  2. 02

    「NVIDIA非依存」の歴史的意義を見落とす:DeepSeek、Qwen、Kimi、Llama はいずれも NVIDIA で訓練されています。openPangu 2.0 は全工程 Ascend 910B で、NVIDIA 非依存ハードウェア上で最先端規模の訓練を完了しオープンソース化した世界初のモデルです。

  3. 03

    総合能力ランキングで 512K の価値を否定する:コードと複雑推論では DeepSeek V4 Pro が依然優位ですが、512K コンテキストは openPangu の差別化の切り札です。長編小説8冊分相当のテキスト量に相当します。

  4. 04

    Flash と Pro の公開スケジュールを混同する:Flash(92B/6B アクティブ)は公開済み。Pro(505B/18B アクティブ)重みは 2026年7月 予定。事前学習/事後学習コードは2026年後半に段階公開されます。

  5. 05

    モデルのみデプロイしホストを計画しない:Ascend スタックは torch_npu、HarmonyOS 端末は Embedded 経路です。Agent が Xcode、Claude Code、OpenClaw も必要なら、モデルは Ascend、ツールチェーンは macOS——マルチモデルルーティング Gateway と同様のレイヤー分割アーキテクチャです。

02

イベントタイムライン、デュアル版パラメータ、7大オープンソースコンポーネント

主要タイムライン

日時イベント
2026-06-12HDC 2026 余承東氏基調講演で openPangu 2.0 正式発表
2026-06-30Flash 重み、基本推論コード、訓練・推論オペレータを GitCode に公開
2026-07(予定)Pro モデル重みと推論コードを公開
2026年後半(予定)事前学習コード、事後学習コード、追加訓練オペレータを順次公開

Pro vs Flash コアパラメータ

指標openPangu 2.0 ProopenPangu 2.0 Flash
総パラメータ数505B92B
アクティブパラメータ数18B6B
スパース比~28:1~15:1(Flash 版 DSA+SWA で極限スパース化可能)
コンテキストウィンドウ512K512K
利用可能状態7月公開予定2026-06-30 公開済み

7大オープンソースコンポーネント(フルスタック公開)

コンポーネント状態
モデル構造(アーキテクチャ定義)公開済み
モデル重み(Flash)2026-06-30 公開
技術レポート重みと同時公開
推論コード + 訓練・推論オペレータ2026-06-30 公開
モデル重み(Pro)2026-07 予定
事前学習コード2026年後半予定
事後学習コード(SFT/RLHF)2026年後半予定

最初の4項目は業界オープンソースの定番です。事前学習コード、事後学習コード、Ascend 訓練オペレータは超大規模 MoE では極めて稀——研究者と企業がゼロから最先端モデルを再現できます。

オープンソースライセンスは Huawei openPangu License:商用利用可、ロイヤリティフリー、非独占。詳細は GitCode Ascend Tribe リポジトリをご確認ください。

03

技術詳解:MoE アーキテクチャ、Ascend 訓練、開発者エコシステム

アーキテクチャ革新

  • mHC(Multi-Head Combinatorial)ルーティング:エキスパートルーティング効率を改善し、MoE 負荷不均衡を低減
  • Muon オプティマイザ:Microsoft 提案の二階モーメンタム方式で大規模訓練の安定性を向上
  • ModAttn(Modular Attention):モジュラー Attention で 512K 超長コンテキストを支える
  • DSA+SWA 超スパース Attention(Flash 専用):極限スパース比を実現。6B アクティブで 92B 知識ベースを呼び出し、推論算力は dense 6B に近い

ハードウェアと訓練のブレークスルー

openPangu 2.0 はNVIDIA 非依存ハードウェア上で全規模訓練を完了した最先端大規模モデルの初事例です。全工程 Huawei Ascend 910B NPU、A100/H100 は不使用。

  • 単一カードスループット:Ascend 上で業界主流オープンソースモデルの 2倍
  • スーパーノード訓練効率:+30% 向上
  • 512K 長シーケンス訓練スループット:+50% 向上
  • 訓練・推論一致率:>99%(MoE モデルの一般的な課題)
  • 推論レイテンシ:同クラスモデルより約 1.2倍 優位
  • 端末 Embedded:30B 端末モデル、推論50%高速化、メモリ20%削減、麒麟チップ搭載スマートフォンでオフライン実行可能
  • Flash-Int8 量子化版:W4A8、メモリ 40% 削減、精度損失 <10%

ソフトウェアスタックとデプロイプラットフォーム

  • CANN(CUDA 相当)+ torch_npu(PyTorch アダプタ)、import torch_npu で Ascend バックエンドに切替
  • クラウド:Huawei Cloud ModelArts API 直接呼び出し
  • オープンソース:GitCode Ascend Tribe から重みを自デプロイ
  • 端末:HarmonyOS ネイティブ統合。HarmonyOS 7 Agent 時代のネイティブ AI エンジン
注意

独立第三者ベンチマークは現在評価中です。下記能力マトリクスはアーキテクチャ推論に基づくもので、実測スコアではありません。結果公開後に本記事を更新します。

04

競合横断比較:パラメータ、能力、シーン選定マトリクス

主要パラメータ比較

モデル総パラメータアクティブコンテキスト訓練ハードウェアオープンソース度
openPangu 2.0 Pro505B18B512KAscend NPUフルスタック(7コンポーネント)
openPangu 2.0 Flash92B6B512KAscend NPUフルスタック(7コンポーネント)
DeepSeek V4 Pro1.6T~200B128KNVIDIA重み+推論
Qwen 3.7 Max~400B+可変128KNVIDIA重み+推論+一部訓練
Kimi K2.71T32B256KNVIDIA重み+推論
Llama 4 405B405B128KNVIDIA重み+推論

能力マトリクス(アーキテクチャ推論、ベンチマーク検証待ち)

能力次元openPangu 2.0 ProDeepSeek V4 ProQwen 3.7 MaxKimi K2.7
コード生成★★★★★★★★★★★★★★★★
複雑推論★★★★★★★★★★★★★★★★★
ツール呼び出し/Agent★★★★★★★★★★★★★★★★★
超長コンテキスト★★★★★★★★★★★★★★★
推論効率★★★★★★★★★★★★★
技術的主権★★★★★
フルスタックオープンソース★★★★★★★★★★★★★★

シーン選定クイックリファレンス

シーン推奨理由
コード生成 / 複雑推論DeepSeek V4 Pro~200B アクティブ、性能リード
Agent / マルチツール協調Kimi K2.7MCP エコシステムが充実
超長文書(>256K Token)openPangu 2.0 Pro512K コンテキストの第一選択
国産化 / コンプライアンス / NVIDIA非依存openPangu 2.0純国産ハードウェア訓練の唯一の最先端モデル
Ascend / Huawei Cloud デプロイopenPangu 2.0ネイティブ最適化、スループット2倍
端末 / スマートフォンデプロイopenPangu Embedded30B 端末、麒麟オフライン
低コストローカル推論openPangu 2.0 Flash6B アクティブ、~96GB で実行可能
05

6ステップ Runbook:ModelArts API と GitCode 自デプロイ

ハードウェア要件参考

バージョン推奨ハードウェア最低構成備考
Flash(6B アクティブ)単一カード Ascend 910B~96GB 統一メモリ大容量メモリシステムでコミュニティテスト可能
Flash-Int8単一カード Atlas A2~48GB メモリW4A8、精度損失 <10%
Pro(18B アクティブ)4+ 枚 Ascend 910Bマルチカードクラスタ7月重み公開後に検証

6ステップ実装ガイド

  1. 01

    パス選択:ハードウェアがない場合は ModelArts API を優先(Huawei Cloud 登録 → AI Gallery → openPangu 2.0 検索 → Flash/Pro 購読)。Ascend クラスタがある場合は GitCode 自デプロイ。

  2. 02

    リポジトリ取得:gitcode.com/org/ascend-tribe にアクセスし、openPangu-2.0-FlashopenPangu-2.0-InferopenPangu-2.0-Op(オペレータ)をクローン。

  3. 03

    CANN + torch_npu 設定:Ascend ドライバと CANN をインストール。PyTorch プロジェクトに import torch_npu を追加してバックエンド切替。

  4. 04

    Flash 単一カード推論:910B 上で推論スクリプトを実行、--context_length 512000 で長コンテキストを検証(メモリに応じて調整)。

  5. 05

    量子化または分散:メモリ不足時は openPangu-2.0-Flash-Int8。Pro 版はマルチカード distributed_inference.py(7月重み後)。

  6. 06

    ドメイン微調整(任意):LoRA 例 finetune.py --method lora --lora_rank 16。事前学習コードは後半オープンソース後に二次事前学習可能。

API 呼び出し例(ModelArts)

bash
curl -X POST "https://modelarts.${REGION}.myhuaweicloud.com/v1/infers/openpangu-2-flash/chat/completions" \
  -H "Content-Type: application/json" \
  -H "X-Auth-Token: ${TOKEN}" \
  -d '{
    "model": "openpangu-2.0-flash",
    "messages": [{"role": "user", "content": "こんにちは、自己紹介をお願いします"}],
    "max_tokens": 1024,
    "temperature": 0.7
  }'

Flash 単一カード推論例

bash
python inference.py \
  --model_path ./openPangu-Flash \
  --device npu:0 \
  --context_length 512000 \
  --precision bf16

引用可能なハードデータ

  • パラメータ規模:Pro 505B/18B、Flash 92B/6B、両版共通 512K コンテキスト
  • Ascend スループット:単一カードで主流オープンソースモデルの 2倍。512K 訓練スループット +50%
  • 訓練・推論一致:MoE 訓練・推論分布一致率 >99%
  • 量子化効果:Flash-Int8 メモリ -40%、精度損失 <10%
  • HarmonyOS Agent:Agent フレームワーク 2.0 複雑タスク成功率 >90%(openPangu 2.0 基盤)
  • コンテキスト比喩:512K ≈ 長編小説8冊分または大規模コードベース全体を1回の prompt に投入可能
06

戦略的意義:国産化、HarmonyOS Agent、クロスプラットフォームホスト選定

米国の A100/H100 対中輸出規制の背景下で、openPangu 2.0 はNVIDIA なしでも最先端 MoE を訓練できることを証明しました。これは技術的成果にとどまらず、「CUDA 独占」というナラティブへの有力な応答です。余承東氏は HDC 2026 で「私の残りの人生の辞書に、第二はない。第一だけだ」と述べました。

フルスタックオープンソースにより、学術研究は訓練を再現でき、企業は垂直領域の二次事前学習が可能になり、開発者は Ascend 算力のハードルを下げられます。HarmonyOS 7 は Agent 時代に全面突入し、openPangu 2.0 はネイティブ AI エンジンです。端末 30B モデルは麒麟スマートフォンでオフライン実行できます。

openPangu 2.0 は総合能力で DeepSeek V4 Pro を必ずしも上回りませんが、512K コンテキスト、国産化、Ascend ネイティブ、フルスタックオープンソース、端末適配の5次元ではほぼ代替不可です。スタックが HarmonyOS Agent + iOS/Xcode CI + OpenClaw マルチモデルルーティング をカバーする場合、Ascend で推論、macOS でツールチェーンという現実的分業が生じます。ノート PC を閉じると深夜タスクが失われ、Linux VPS には Metal と Keychain がありません。VpsMesh Mac Mini M4 クラウドレンタルは 7×24 uptime とネイティブ Apple ツールチェーンを月額 OpEx にパッケージ化します。プランは Mac Mini M4 レンタル料金、デプロイは ヘルプセンターをご覧ください。

免責事項:一部ベンチマークはアーキテクチャ推論評価です。独立第三者の結果公開後に継続更新します。公開日:2026年7月1日。

よくある質問

読者から最も多い3つの質問

Flash(92B/6B アクティブ)は6月30日公開済み、910B 単一カードで推論可能、高並行 API に適しています。Pro(505B/18B アクティブ)は7月公開予定、512K 長文書と二次事前学習の第一選択です。重みは GitCode Ascend Tribe をご確認ください。

コードと複雑推論は DeepSeek V4 Pro(~200B アクティブ)を選択。512K コンテキスト、国産化コンプライアンス、Ascend 2倍スループット、フルスタック訓練コードは openPangu 2.0 を選択。マルチモデル併存は OpenClaw マルチモデルルーティング を参照してください。

純粋な Ascend/ModelArts のみなら不要です。スタックに Xcode、Claude Code、OpenClaw デーモンがある場合は Mac Mini M4 月額レンタルがより安定します。プランは Mac Mini M4 レンタル料金、申込は 注文ページです。