openPangu 2.0 Flash と Pro の違いは何ですか？

Flash版は92B総パラメータ・6Bアクティブで6月30日にGitCode公開済み、Ascend 910B単一カードで推論可能です。Pro版は505B総パラメータ・18Bアクティブ、512Kコンテキスト、重みは7月公開予定で、超長文書と二次事前学習に適しています。

openPangu 2.0 と DeepSeek V4 Pro はどう選びますか？

コード生成と複雑推論はDeepSeek V4 Pro（約200Bアクティブ）が優位です。512Kコンテキスト、国産化コンプライアンス、Ascendネイティブスループット、フルスタック訓練コード公開ではopenPangu 2.0がほぼ代替不可です。

クロスプラットフォーム Agent 開発に Mac Mini レンタルは必須ですか？

純粋なAscend/ModelArtsのみなら不要です。スタックにXcode、Claude Code、OpenClawデーモンがある場合はMac Mini M4月額レンタルの方が安定します。プランはMac Mini M4レンタル料金、申込は注文ページをご覧ください。

Huawei openPangu 2.0 オープンソース公開：505B MoE、512Kコンテキスト、Ascendフルスタック解説

01

openPangu 2.0 を理解する前に、5つのよくある誤解を解く

余承東氏は HDC 2026（2026年6月12日、東莞松山湖）で openPangu 2.0 を正式発表し、6月30日に Flash 版が先行オープンソース化されました。多くの議論は「また一つの国産大規模モデル」に留まっています。以下の盲点はデプロイと調達判断に直接影響します。

01
オープンソース＝「重みのみ」と混同する：業界標準は重み+推論のみの公開です。openPangu 2.0 は事前学習・事後学習コードと Ascend 訓練オペレータの公開を計画しており、超大規模 MoE では極めて稀なフルスタックオープンソースです。
02
「NVIDIA非依存」の歴史的意義を見落とす：DeepSeek、Qwen、Kimi、Llama はいずれも NVIDIA で訓練されています。openPangu 2.0 は全工程 Ascend 910B で、NVIDIA 非依存ハードウェア上で最先端規模の訓練を完了しオープンソース化した世界初のモデルです。
03
総合能力ランキングで 512K の価値を否定する：コードと複雑推論では DeepSeek V4 Pro が依然優位ですが、512K コンテキストは openPangu の差別化の切り札です。長編小説8冊分相当のテキスト量に相当します。
04
Flash と Pro の公開スケジュールを混同する：Flash（92B/6B アクティブ）は公開済み。Pro（505B/18B アクティブ）重みは 2026年7月 予定。事前学習/事後学習コードは2026年後半に段階公開されます。
05
モデルのみデプロイしホストを計画しない：Ascend スタックは torch_npu、HarmonyOS 端末は Embedded 経路です。Agent が Xcode、Claude Code、OpenClaw も必要なら、モデルは Ascend、ツールチェーンは macOS——マルチモデルルーティング Gateway と同様のレイヤー分割アーキテクチャです。

02

イベントタイムライン、デュアル版パラメータ、7大オープンソースコンポーネント

主要タイムライン

日時	イベント
2026-06-12	HDC 2026 余承東氏基調講演で openPangu 2.0 正式発表
2026-06-30	Flash 重み、基本推論コード、訓練・推論オペレータを GitCode に公開
2026-07（予定）	Pro モデル重みと推論コードを公開
2026年後半（予定）	事前学習コード、事後学習コード、追加訓練オペレータを順次公開

Pro vs Flash コアパラメータ

指標	openPangu 2.0 Pro	openPangu 2.0 Flash
総パラメータ数	505B	92B
アクティブパラメータ数	18B	6B
スパース比	~28:1	~15:1（Flash 版 DSA+SWA で極限スパース化可能）
コンテキストウィンドウ	512K	512K
利用可能状態	7月公開予定	2026-06-30 公開済み

7大オープンソースコンポーネント（フルスタック公開）

コンポーネント	状態
モデル構造（アーキテクチャ定義）	公開済み
モデル重み（Flash）	2026-06-30 公開
技術レポート	重みと同時公開
推論コード + 訓練・推論オペレータ	2026-06-30 公開
モデル重み（Pro）	2026-07 予定
事前学習コード	2026年後半予定
事後学習コード（SFT/RLHF）	2026年後半予定

最初の4項目は業界オープンソースの定番です。事前学習コード、事後学習コード、Ascend 訓練オペレータは超大規模 MoE では極めて稀——研究者と企業がゼロから最先端モデルを再現できます。

オープンソースライセンスは Huawei openPangu License：商用利用可、ロイヤリティフリー、非独占。詳細は GitCode Ascend Tribe リポジトリをご確認ください。

03

技術詳解：MoE アーキテクチャ、Ascend 訓練、開発者エコシステム

アーキテクチャ革新

mHC（Multi-Head Combinatorial）ルーティング：エキスパートルーティング効率を改善し、MoE 負荷不均衡を低減
Muon オプティマイザ：Microsoft 提案の二階モーメンタム方式で大規模訓練の安定性を向上
ModAttn（Modular Attention）：モジュラー Attention で 512K 超長コンテキストを支える
DSA+SWA 超スパース Attention（Flash 専用）：極限スパース比を実現。6B アクティブで 92B 知識ベースを呼び出し、推論算力は dense 6B に近い

ハードウェアと訓練のブレークスルー

openPangu 2.0 はNVIDIA 非依存ハードウェア上で全規模訓練を完了した最先端大規模モデルの初事例です。全工程 Huawei Ascend 910B NPU、A100/H100 は不使用。

単一カードスループット：Ascend 上で業界主流オープンソースモデルの 2倍
スーパーノード訓練効率：約 +30% 向上
512K 長シーケンス訓練スループット：約 +50% 向上
訓練・推論一致率：>99%（MoE モデルの一般的な課題）
推論レイテンシ：同クラスモデルより約 1.2倍 優位
端末 Embedded：30B 端末モデル、推論50%高速化、メモリ20%削減、麒麟チップ搭載スマートフォンでオフライン実行可能
Flash-Int8 量子化版：W4A8、メモリ 40% 削減、精度損失 <10%

ソフトウェアスタックとデプロイプラットフォーム

CANN（CUDA 相当）+ torch_npu（PyTorch アダプタ）、import torch_npu で Ascend バックエンドに切替
クラウド：Huawei Cloud ModelArts API 直接呼び出し
オープンソース：GitCode Ascend Tribe から重みを自デプロイ
端末：HarmonyOS ネイティブ統合。HarmonyOS 7 Agent 時代のネイティブ AI エンジン

注意

独立第三者ベンチマークは現在評価中です。下記能力マトリクスはアーキテクチャ推論に基づくもので、実測スコアではありません。結果公開後に本記事を更新します。

04

競合横断比較：パラメータ、能力、シーン選定マトリクス

主要パラメータ比較

モデル	総パラメータ	アクティブ	コンテキスト	訓練ハードウェア	オープンソース度
openPangu 2.0 Pro	505B	18B	512K	Ascend NPU	フルスタック（7コンポーネント）
openPangu 2.0 Flash	92B	6B	512K	Ascend NPU	フルスタック（7コンポーネント）
DeepSeek V4 Pro	1.6T	~200B	128K	NVIDIA	重み+推論
Qwen 3.7 Max	~400B+	可変	128K	NVIDIA	重み+推論+一部訓練
Kimi K2.7	1T	32B	256K	NVIDIA	重み+推論
Llama 4 405B	405B	—	128K	NVIDIA	重み+推論

能力マトリクス（アーキテクチャ推論、ベンチマーク検証待ち）

能力次元	openPangu 2.0 Pro	DeepSeek V4 Pro	Qwen 3.7 Max	Kimi K2.7
コード生成	★★★	★★★★★	★★★★	★★★★
複雑推論	★★★	★★★★★	★★★★★	★★★★
ツール呼び出し/Agent	★★★★	★★★★	★★★★	★★★★★
超長コンテキスト	★★★★★	★★★	★★★	★★★★
推論効率	★★★★★	★★	★★	★★★★
技術的主権	★★★★★	★	★	★
フルスタックオープンソース	★★★★★	★★★	★★★	★★★

シーン選定クイックリファレンス

シーン	推奨	理由
コード生成 / 複雑推論	DeepSeek V4 Pro	~200B アクティブ、性能リード
Agent / マルチツール協調	Kimi K2.7	MCP エコシステムが充実
超長文書（>256K Token）	openPangu 2.0 Pro	512K コンテキストの第一選択
国産化 / コンプライアンス / NVIDIA非依存	openPangu 2.0	純国産ハードウェア訓練の唯一の最先端モデル
Ascend / Huawei Cloud デプロイ	openPangu 2.0	ネイティブ最適化、スループット2倍
端末 / スマートフォンデプロイ	openPangu Embedded	30B 端末、麒麟オフライン
低コストローカル推論	openPangu 2.0 Flash	6B アクティブ、~96GB で実行可能

05

6ステップ Runbook：ModelArts API と GitCode 自デプロイ

ハードウェア要件参考

バージョン	推奨ハードウェア	最低構成	備考
Flash（6B アクティブ）	単一カード Ascend 910B	~96GB 統一メモリ	大容量メモリシステムでコミュニティテスト可能
Flash-Int8	単一カード Atlas A2	~48GB メモリ	W4A8、精度損失 <10%
Pro（18B アクティブ）	4+ 枚 Ascend 910B	マルチカードクラスタ	7月重み公開後に検証

6ステップ実装ガイド

01
パス選択：ハードウェアがない場合は ModelArts API を優先（Huawei Cloud 登録 → AI Gallery → openPangu 2.0 検索 → Flash/Pro 購読）。Ascend クラスタがある場合は GitCode 自デプロイ。
02
リポジトリ取得：gitcode.com/org/ascend-tribe にアクセスし、openPangu-2.0-Flash、openPangu-2.0-Infer、openPangu-2.0-Op（オペレータ）をクローン。
03
CANN + torch_npu 設定：Ascend ドライバと CANN をインストール。PyTorch プロジェクトに import torch_npu を追加してバックエンド切替。
04
Flash 単一カード推論：910B 上で推論スクリプトを実行、--context_length 512000 で長コンテキストを検証（メモリに応じて調整）。
05
量子化または分散：メモリ不足時は openPangu-2.0-Flash-Int8。Pro 版はマルチカード distributed_inference.py（7月重み後）。
06
ドメイン微調整（任意）：LoRA 例 finetune.py --method lora --lora_rank 16。事前学習コードは後半オープンソース後に二次事前学習可能。

API 呼び出し例（ModelArts）

bash

curl -X POST "https://modelarts.${REGION}.myhuaweicloud.com/v1/infers/openpangu-2-flash/chat/completions" \
  -H "Content-Type: application/json" \
  -H "X-Auth-Token: ${TOKEN}" \
  -d '{
    "model": "openpangu-2.0-flash",
    "messages": [{"role": "user", "content": "こんにちは、自己紹介をお願いします"}],
    "max_tokens": 1024,
    "temperature": 0.7
  }'

Flash 単一カード推論例

bash

python inference.py \
  --model_path ./openPangu-Flash \
  --device npu:0 \
  --context_length 512000 \
  --precision bf16

引用可能なハードデータ

パラメータ規模：Pro 505B/18B、Flash 92B/6B、両版共通 512K コンテキスト
Ascend スループット：単一カードで主流オープンソースモデルの 2倍。512K 訓練スループット +50%
訓練・推論一致：MoE 訓練・推論分布一致率 >99%
量子化効果：Flash-Int8 メモリ -40%、精度損失 <10%
HarmonyOS Agent：Agent フレームワーク 2.0 複雑タスク成功率 >90%（openPangu 2.0 基盤）
コンテキスト比喩：512K ≈ 長編小説8冊分または大規模コードベース全体を1回の prompt に投入可能

06

戦略的意義：国産化、HarmonyOS Agent、クロスプラットフォームホスト選定

米国の A100/H100 対中輸出規制の背景下で、openPangu 2.0 はNVIDIA なしでも最先端 MoE を訓練できることを証明しました。これは技術的成果にとどまらず、「CUDA 独占」というナラティブへの有力な応答です。余承東氏は HDC 2026 で「私の残りの人生の辞書に、第二はない。第一だけだ」と述べました。

フルスタックオープンソースにより、学術研究は訓練を再現でき、企業は垂直領域の二次事前学習が可能になり、開発者は Ascend 算力のハードルを下げられます。HarmonyOS 7 は Agent 時代に全面突入し、openPangu 2.0 はネイティブ AI エンジンです。端末 30B モデルは麒麟スマートフォンでオフライン実行できます。

openPangu 2.0 は総合能力で DeepSeek V4 Pro を必ずしも上回りませんが、512K コンテキスト、国産化、Ascend ネイティブ、フルスタックオープンソース、端末適配の5次元ではほぼ代替不可です。スタックが HarmonyOS Agent + iOS/Xcode CI + OpenClaw マルチモデルルーティング をカバーする場合、Ascend で推論、macOS でツールチェーンという現実的分業が生じます。ノート PC を閉じると深夜タスクが失われ、Linux VPS には Metal と Keychain がありません。VpsMesh Mac Mini M4 クラウドレンタルは 7×24 uptime とネイティブ Apple ツールチェーンを月額 OpEx にパッケージ化します。プランは Mac Mini M4 レンタル料金、デプロイはヘルプセンターをご覧ください。

免責事項：一部ベンチマークはアーキテクチャ推論評価です。独立第三者の結果公開後に継続更新します。公開日：2026年7月1日。

よくある質問

読者から最も多い3つの質問

Flash（92B/6B アクティブ）は6月30日公開済み、910B 単一カードで推論可能、高並行 API に適しています。Pro（505B/18B アクティブ）は7月公開予定、512K 長文書と二次事前学習の第一選択です。重みは GitCode Ascend Tribe をご確認ください。

コードと複雑推論は DeepSeek V4 Pro（~200B アクティブ）を選択。512K コンテキスト、国産化コンプライアンス、Ascend 2倍スループット、フルスタック訓練コードは openPangu 2.0 を選択。マルチモデル併存は OpenClaw マルチモデルルーティングを参照してください。

純粋な Ascend/ModelArts のみなら不要です。スタックに Xcode、Claude Code、OpenClaw デーモンがある場合は Mac Mini M4 月額レンタルがより安定します。プランは Mac Mini M4 レンタル料金、申込は注文ページです。