AI Today
ホーム > 比較記事 > AIを動かすチップの世界|NVIDIA一強が終わりかけている話

AIを動かすチップの世界|NVIDIA一強が終わりかけている話

目次


結論:2026年5月のAIコンピュートは「NVIDIA一強の揺らぎ × 米中二極化」

「AIコンピュートって、いまどこまで来てるの?」と聞かれることが多くなりました。

少し前までは「とりあえずNVIDIA」で答えが終わっていましたが、2026年5月の景色はもう違います。

私の結論はこう。

  • NVIDIAは依然として圧倒的(Q1 FY27 売上$81.6B / 自社株買い$80B)
  • しかし「TPU・Trainium・Maia・Ascend」が真剣な代替として運用フェーズに入った
  • Anthropicは1社で「NVIDIA / Google TPU / AWS Trainium / Microsoft Maia」の4種を並走
  • ByteDance Huawei Ascend $5.6B 受注で、米中の二極化が本格化
  • 5GW級データセンター が「常識」になり、電力・冷却が新たな制約

つまりAIコンピュートは「NVIDIA一強」から「マルチアーキテクチャ + 電力制約」のフェーズに移行した、というのが5月時点の景色です。

このガイドでは、NVIDIA Blackwell/Rubin、Google TPU、AWS Trainium、Microsoft Maia、Huawei Ascend の最新動向、新興技術、コスト試算、電力インフラ、企業の調達戦略まで一枚絵で整理していきます。

2026年5月時点のAIコンピュート業界マップ

まず、5月時点の主要プレイヤーと最新の数字を一覧にします。

プレイヤー主力チップ5月の重要動き主要顧客
NVIDIABlackwell / RubinQ1 FY27 $81.6B / $80B 買戻しxAI / Anthropic / Meta / 国家
GoogleTPU v6 TrilliumAnthropic $40B + Broadcom $21BAnthropic / 自社 / Salesforce
AWSTrainium 3Anthropic $5B / AWS $100B / 5GWAnthropic / 一部スタートアップ
MicrosoftMaia 200Anthropic提携交渉中自社(Azure)
HuaweiAscend 950PRByteDance $5.6B / BAT $12-15BByteDance / Alibaba / Tencent
MetaMTIA内部利用拡大自社
CerebrasWSEOpenAI推論$20B契約OpenAI / 政府
TenstorrentGalaxy Blackhole110K / 23PFlops GA一部企業

特に目を引くのは、AnthropicがNVIDIA・Google・AWS・Microsoftの4プラットフォームを同時運用していることです。これは「単一ベンダー依存リスク」を避けると同時に、最適コスト・最適パフォーマンスを獲得する戦略でもあります。

詳細考察:Anthropic × SpaceX × Colossus / 220K GPU / Anthropic × Broadcom $21B / TPU 3.5GW / Anthropic × AWS $5B / 100B / Trainium / Anthropic × Microsoft Maia 200 提携

NVIDIA Blackwell / Rubin 完全解説

NVIDIAは引き続きAIコンピュートの中心ですが、2026年5月時点での「現在地」と「次の一手」を整理します。

Q1 FY27 決算ハイライト

指標数字コメント
売上$81.6Bアナリスト予想 Beat
自社株買い$80B史上最大級規模
データセンター部門全体の8割超AI需要が主因
粗利率70%台引き続き高水準

参考:NVIDIA Q1 FY27 80B 自社株買い決算

Blackwell:現役主力

  • B200 / B300 シリーズが量産フェーズ
  • SpaceX Colossus に 220K GPU が配備(Anthropic向け)
  • 価格は B300 で1台あたり数万ドル後半〜10万ドル超
  • 電力消費は1ラック15-30kW級、冷却は液冷が標準化

参考:NVIDIA Blackwell × Anthropic × SpaceX Colossus / NVIDIA Blackwell B200/B300 価格と需要

Rubin:次世代主役(Q3 2026 量産確定)

指標Rubin対 Blackwell 比較
量産開始2026年Q3計画前倒し
推論性能約3.5倍NVIDIA公称
推論専用版Rubin GPU 50 PFLOPS新カテゴリ
メモリ帯域HBM4世代帯域大幅増
主要顧客ハイパースケーラ4社早期割り当て

参考:NVIDIA Rubin Q3 2026 ランプ / Blackwell ハイパースケーラ / NVIDIA Rubin GPU 50 PFLOPS 推論時代 / NVIDIA Rubin 2026 H2 推論コスト / Vera Rubin 200 Q4 2026 パートナー

Anthropic × SpaceX × Colossus $45B 契約

NVIDIA Blackwell の最大顧客の1つが、SpaceX が運営するColossusデータセンターを介したAnthropicです。

  • 契約規模:$45B(解約条項込み)
  • 配備GPU:B300 級が220K台規模
  • ロケーション:メンフィス(Colossus 1) + 拡張計画
  • 用途:Claude モデルの学習・推論(一部 Trainium / TPU と並列)

参考:Anthropic × SpaceX $45B 確定 / 解約条項 / Anthropic × SpaceX $52B 月間コンピュート / Anthropic × SpaceX Colossus 1 / 220K GPU / xAI Colossus 2 / 550K Blackwell / メンフィス

IREN × NVIDIA $3.4B:NeoCloud の「中央銀行化」

NeoCloud(NVIDIA GPUを大量保有して企業に貸し出すクラウド事業者)が、2026年に1段スケールアップしました。

  • IREN は NVIDIA と $3.4B 規模の長期契約を締結
  • 「GPUの中央銀行」のような役割で、需要急変動の緩衝役
  • CoreWeave、Crusoe、Lambda などと並ぶレイヤー

参考:IREN × NVIDIA $3.4B AI クラウド NeoCloud / CoreWeave Q1 2026 売上倍増 / $99B バックログ / Rubin 5月

NVIDIA Verified Agent Skills

NVIDIAは2026年5月、SkillSpectorと連動したVerified Agent Skillsを発表しました。AIエージェント時代のガバナンス層でも、NVIDIAがエコシステムの中心に立とうとしています。

参考:NVIDIA Verified Agent Skills × SkillSpector ガバナンス

Google TPU 戦略:Anthropic $40B + Broadcom $21B

GoogleのTPUは「自社内」だけの存在から、Anthropicという巨大顧客を巻き込んで本格的にNVIDIAの代替に育ちました。

Anthropic × Google $40B 投資

  • 投資規模:$40B
  • 目的:Anthropic向けTPU調達と長期パートナーシップ
  • 投資前評価:Anthropic $900B 級

Anthropic × Broadcom $21B TPU 契約

  • Broadcomを介したTPUカスタムASIC供給で $21B 規模
  • 3.5GW 級のコンピュート確保
  • 「マルチポーラー」(多極化)ハードウェア戦略の象徴

TPU v6 Trillium

  • 学習・推論双方で世代更新
  • HBM3e世代の高帯域メモリ
  • 1ポッド単位のスケーラビリティで NVIDIA NVL ラックに対抗

参考:Google × Anthropic $40B 投資 / コンピュート / Anthropic × Broadcom $21B TPU 3.5GW / Anthropic × Google × Broadcom TPU 35GW インフラ戦争 / Anthropic 30B Revenue × Google × Broadcom 35GW Compute

3.5GW 規模調達の意味

3.5GW という数字は、原発3基分のオーダーです。これだけの電力を1企業の1モデル(Claude)が必要とする、というのが2026年の物理的な現実です。

Blackstone × Google TPU クラウドJV

参考:Blackstone × Google TPU Cloud JV 500MW 2027 / Google Cloud Next 2026 Gemini 3.1 TPU 8T エージェント

AWS Trainium 戦略:Anthropic $5B + AWS $100B + 5GW

AWSのTrainiumは、Anthropicと組むことで「事実上のNVIDIA代替」として確立しました。

契約構造

項目規模補足
Anthropic投資$5B 規模戦略パートナー強化
AWS利用枠$100B 規模数年契約
電力5GW 級専用データセンター
主力チップTrainium 3量産フェーズ
推論Inferentia 2/3一部用途

戦略の核:「Trainium派生コスト最安」

Anthropicが Trainium に張る理由は、推論コストの最適化です。Claudeは利用量がエクスポネンシャルに増えており、推論のドル単価を下げないと事業として持続しません。Trainium カスタム最適化により、$/トークンを大幅に下げる戦略です。

参考:Anthropic × AWS $100B / 5GW / Trainium メガディール / Amazon × Anthropic $25B / OpenAI $50B / インフラ二重戦略 / Amazon × Anthropic $33B AI Infrastructure War / AWS Q1 2026 / OpenAI $100B / Amazon $50B / Azure 揺さぶり / AWS AI Revenue $15B / Amazon $200B Capex

Microsoft Maia 200:独自チップとAnthropic提携交渉

Microsoftは長らくOpenAIに依存してきましたが、2026年は独自チップ「Maia 200」とAnthropicとの提携交渉で「単独路線」に舵を切りました。

Maia 200 のポジション

  • AI学習・推論両用の独自設計ASIC
  • Azure データセンターでの大量配備が想定
  • NVIDIA調達コスト削減と垂直統合の両立を狙う

Anthropic × Microsoft Maia 提携交渉

  • 2026年5月時点で「交渉中」
  • 成立すれば Anthropic は5プラットフォーム並走に拡大
  • Microsoft 側は Copilot Cowork に Claude を取り込み済み

Microsoft の OpenAI 依存緩和

動き内容
Microsoft MAI モデルOpenAI独立路線
Microsoft Foundryマルチモデル基盤
Microsoft × Anthropic CoworkM365 Copilot既定統合
OpenAI排他性 2032まで一定の独立性確保

参考:Anthropic × Microsoft Maia 200 提携 / Microsoft MAI Models Foundry OpenAI Independence / Microsoft × Anthropic Copilot Cowork M365 既定 / Microsoft × OpenAI 排他性 2032 IP ライセンス

Huawei Ascend 950PR:ByteDance $5.6B / BAT $12-15B

中国側ではHuaweiのAscendが、米中の「AIコンピュート二極化」の主役になりました。

Huawei Ascend 950PR の概要

  • 発表:2026年5月22日
  • 性能:推論で NVIDIA H200 級
  • 量産:2026年後半に本格化
  • 制約:HBM 調達と先端プロセスは依然ボトルネック

ByteDance $5.6B 受注

  • ByteDance(TikTok運営)が単独で $5.6B
  • AscendとカスタムASICの組合せ
  • 中国国内の生成AI推論を支える基盤に

BAT(Baidu / Alibaba / Tencent)合計 $12-15B 予想

  • 中国の主要3社が並行調達
  • 米国チップ規制下で「国内チップ」への切替が政策的にも推奨
  • DeepSeek / Kimi / Qwen など中国製モデルも Ascend 最適化

参考:Huawei Ascend 950PR / BAT $12-15B / 中国AI独立 / Huawei Ascend 950PR ByteDance 中国AI独立 5月 / Huawei Ascend 950 ByteDance 中国AI 5月 / Huawei Ascend 950PR / 中国AIスタック独立 / Huawei 中国AIチップ王座 推論シフト 2026 / DeepSeek V4 × Huawei Ascend / NVIDIA独立 / 米中分断

米中AI hardware 二極化の意味

これにより、世界のAIインフラは「NVIDIA + TPU + Trainium + Maia の西側」と「Ascend + 中国製ASIC の東側」の二極構造に固定化します。SaaS提供企業にとっては、中国市場向けに別系統のスタックを用意する必要が出てきます。

参考:NVIDIA H200 × 中国デカップリング 5月 / Cheap AI × 中国の脅威 / OpenAI / Anthropic / IPO 5月

新興技術:光-物質コンピューティング・量子・専用ASIC

NVIDIA / TPU / Trainium / Maia / Ascend の「主流5強」以外にも、次の一手を狙う技術が複数立ち上がっています。

Penn 光-物質ポラリトン光AIコンピューティング

  • ペンシルベニア大学:光-物質エキシトンポラリトンを使ったAI演算
  • 電気ベースの限界(電力・冷却)を物理的に突破できる可能性
  • 商用化はまだ先(5-10年)だが研究投資が活発化

参考:Penn × Exciton Polariton 光AIコンピューティング 5月

量子コンピュータと AI の融合

  • NVIDIA IsingでイジングマシンとAIの組合せが商用ステージへ
  • IBM Think 2026 でクラウド量子 + エンタープライズAIの方向性
  • 量子優位(Quantum Advantage)の実利用はまだ限定的

参考:NVIDIA Ising 量子AI オープンソース エラー訂正 / IBM Think 2026 / Krishna エンタープライズAI / 量子

Etched Sohu:Transformer専用ASIC

  • $500M-$5B 規模の評価
  • Transformerに特化したASICでNVIDIA H100に挑戦
  • 単一ワークロード(推論)で圧倒的TCOを狙う

参考:Etched Sohu $500M-$5B Transformer ASIC × NVIDIA H100 / Etched Sohu $500M Transformer ASIC × NVIDIA 2026

Cerebras:超大規模ウェハ × OpenAI推論$20B

  • ウェハスケールチップ「WSE」シリーズ
  • OpenAIと$20B規模の推論契約
  • IPO評価額$35B予想

参考:Cerebras IPO × OpenAI $20B 推論 × NVIDIA終焉 / Cerebras IPO $35B Valuation × NVIDIA AIチップ市場

Tenstorrent Galaxy Blackhole

  • GA:110K構成 / 23 PFLOPS
  • NVIDIA代替を狙うオープンアーキテクチャ

参考:Tenstorrent Galaxy Blackhole GA × 110K / 23PFLOPS / NVIDIA代替

Meta MTIA:自社向け推論ASIC

  • Meta独自の推論ASIC
  • 主に広告推論・コンテンツ推薦で活用
  • NVIDIA依存緩和の意図

参考:Meta MTIA Chip × NVIDIA独立 / Meta Q1 2026 Reality Labs $4B Loss / AI Capex $145B

UCSDピエゾ素子チップ:電力効率の次世代

  • GPU の電力効率を桁違いに引き上げる研究
  • データセンターの電力制約への解の1つ

参考:UCSD ピエゾ素子チップ × GPU 電力効率 × データセンター

AI学習・推論コスト試算:モデル別・規模別

「結局AIを動かすといくらかかるの?」を整理します。

学習コスト(フロンティアモデル)

モデル規模学習費用目安計算リソース期間
数十Bパラメータ$20M-$80M数百 GPU数週間
100B級$80M-$300M数千 GPU1-2カ月
1T級$500M-$2B+数万 GPU数カ月
10T級$5B-$20B+10万 GPU 級半年

推論コスト(API利用ベース)

モデル入力 $/1M tok出力 $/1M tok
Claude Opus 4.6$5$25
Claude Sonnet 4.6$3$15
GPT-5.5 系(クラス想定)$5-$15$20-$60
中国製OSSモデル(DeepSeek系)$0.3-$1$1-$3

自社運用 vs API利用の損益分岐

自社運用が有利になるのは、概ね「月間1兆トークン超」を継続的に消費する場合。それ未満であれば、APIまたはクラウド経由が経済合理的です。

ただし、データ主権・規制対応・レイテンシ要件で自社運用が必要になるケースは増えています。

参考:AIコーディングツール料金比較2026 / 個社別 API トークン単価

電力・冷却インフラ:5GW級データセンターの現実

2026年の最大の制約は、もはやチップではなく「電力」です。

5GW級データセンターが当たり前に

プレイヤー規模ロケーション
Anthropic × AWS5GW級北米複数州
Anthropic × Google TPU3.5GW級北米複数州
Meta Holly Ridge27B規模ルイジアナ
xAI Colossus 2ギガワット級メンフィス
Helion × OpenAI 核融合5GW (2030)アリゾナ

参考:Meta Holly Ridge ルイジアナ $27B データセンター / Helion × OpenAI 核融合 5GW 2030 / AIパワー危機 / Microsoft × Helion Malaga 核融合 × AI データセンター 2028

電力ボトルネックの現実

  • 米国の一部州ですでに「データセンター新設に電力を割り当てられない」状態
  • Lake Tahoe NV Energy では49,000戸分の電力をデータセンター1つが消費
  • 電力価格高止まりで、AI事業の限界費用が上昇

参考:AIデータセンター電力危機 ボトルネック 2026 / Lake Tahoe NV Energy 49,000 データセンター 5月 / Public Sours on AI Data Centers / IPOリスク / Demis Hassabis AGI 2030 / 電気の影響

冷却技術

  • 液冷(直接液浸 / コールドプレート)が標準化
  • 熱回収(地域熱供給への接続)の試行
  • 1ラックあたり50kW以上の高密度ラックが当たり前に

立地戦略

  • 安価な電力(風力・水力・原子力)と接続性のバランス
  • 規制と地元コミュニティ調整が新たな実務課題
  • 核融合・小型原子炉が中長期の解として注目

企業の調達戦略:マルチクラウド・オンプレ・ハイブリッド

最後に、企業(特にエンタープライズ)はAIコンピュートをどう調達すべきか、を整理します。

5つの選択肢

選択肢向くケース留意点
パブリッククラウド API大半の業務・PoCレイテンシ・コスト変動
クラウドGPUインスタンスカスタム学習・推論スポット供給不安定
専用クラスター予約大規模学習・SLA要件長期契約・高額
オンプレGPUデータ主権・常時推論投資・人材・電力
NeoCloud / 専門事業者中規模高負荷・短期突発価格変動・SLA

マルチクラウド戦略の標準形

  • 学習:Anthropic / OpenAI / Google / 内製 のうち2-3を並列
  • 推論:APIをデフォルトに、レイテンシ要件で必要なら専用クラスター
  • 評価:ベンダーロックインを避けるためのスイッチング設計

リスク分散の3軸

  1. ベンダー集中リスク:単一ベンダーの障害・価格変更で全業務停止を避ける
  2. 地政学リスク:米中分断を見据えた地域別調達設計
  3. 規制リスク:EU AI Act / 各国データ主権規制対応

参考:Big Tech 2026 Q1 決算 / AI Capex $650B / 収益化 / Q1 2026 VC $300B / AI 集中 / バブル / Q1 2026 VC $300B / Top 4 独占

2026年下半期-2027年の展望

最後に、2026年下半期から2027年にかけて起こりそうな変化を5つ整理します。

1. Rubin 量産の本格化(Q3 2026〜)

NVIDIA Rubin の量産が始まると、推論性能が現行 Blackwell の3.5倍に伸びます。これにより推論$/トークンがさらに下がり、AIアプリケーションのコスト構造が再設計されます。

2. TPU・Trainium のシェア拡大(年末で計15-25%目安)

Anthropic 1社の効果だけで、TPUとTrainiumの世界シェアが大きく動きます。これにNVIDIA以外の選択肢を取りやすい企業が乗ることで、エコシステムの厚みが増します。

3. 米中分断シナリオの固定化

Huawei Ascend 950PR + ByteDance $5.6B + BAT $12-15B により、中国市場では「Ascend スタックが既定」になります。米国系企業が中国市場でAIサービスを提供するハードルがさらに上がります。

4. 5GWデータセンター以上の登場

xAI Colossus 2、Helion + OpenAI 核融合(2030予定)、Anthropic + AWS 5GW など、ギガワット級の常設データセンターが10件規模で稼働開始します。電力供給契約と立地が、新たな経営アジェンダになります。

5. 新興チップの「特化型勝負」

汎用GPU(NVIDIA)とは別の軸で、Cerebras / Etched / Tenstorrent / Meta MTIA / UCSDピエゾ素子のような「特化型ASIC」が、特定ワークロード(学習・推論・推薦・低消費電力)で頭角を表します。

参考:AI Industry 5/18-22 週次 / 6つのテクトニックシフト / Anthropic Q2 $10.9B 初の四半期黒字 / Anthropic ARR $14B / Claude Code 5月

関連ニュース・考察

直近の関連ニュースと考察を一覧でまとめます。

まとめ:2026年5月時点でのAIコンピュート戦略メッセージ

ここまでをひと言で集約すると、こうなります。

AIコンピュートは「NVIDIA一強の揺らぎ × 米中二極化 × 電力制約」が3本柱の時代に入った。

NVIDIAは依然として強力ですが、TPU・Trainium・Maia・Ascendが本物の選択肢になりました。Anthropicが1社で4プラットフォーム並走している事実は、エンタープライズの新標準になります。

そして電力は「世界一稀少な資源」になりつつあります。5GW級データセンターの常識化と、それに伴う電力契約・規制対応・地政学リスクが、AI戦略の中心議題に上がってきました。

企業の実務として今からやるべきことは3つです。

  1. マルチアーキテクチャを前提に設計する(特定ベンダーの仕様に深く依存しない)
  2. API + 専用クラスター + NeoCloud のミックスを使い分ける
  3. 米中分断シナリオを織り込んだ地域別調達設計を持つ

エンタープライズの全体像は 企業向けAI導入完全マップ2026 に、コーディング用途の単価は AIコーディングツール料金比較2026 にまとめています。

FAQ

よくある質問

この記事はどんな内容ですか?
2026年5月最新のAIコンピュート業界マップを完全解説しました。NVIDIA Blackwell/Rubin、Google TPU、AWS Trainium、Microsoft Maia、Huawei Ascendの性能・調達戦略・コスト構造、$45B Colossus、$40B Anthropic-Google、$5B Trainium、5GWデータセンターまで実例ベースで網羅します。
情報はいつ時点のものですか?
2026-05-24時点でまとめた情報です。NVIDIA Q1 FY27決算、Huawei Ascend 950PR 発表(5/22)、Anthropic-AWS / Google / Microsoft / SpaceXの5月主要発表を反映しています。AIハードウェア領域は半年単位で景色が変わるため、最新の公式発表もあわせて確認してください。
NVIDIAの優位はいつまで続きますか?
短期的にはRubinの3.5倍性能で2027-2028年も主導権を握る可能性が高いです。ただし、Anthropicの4プラットフォーム並走、Huawei Ascendの中国制覇、Cerebras / Etched / Tenstorrentの特化型ASICの登場により、世界シェアは段階的に低下し、2027年末でデータセンターシェア60-70%が現実的なシナリオです。
TPUとTrainiumのどちらを優先すべきですか?
用途次第です。Google Cloud基盤上で、Geminiやマルチモーダルとの統合を重視するならTPU。AWS基盤上で、Claudeとの密結合とコスト最適化を重視するならTrainium。マルチクラウド前提なら両方を評価軸に入れるのが現実解です。
Huawei Ascendは米国企業も使えますか?
原則として米国輸出規制の対象で、米国企業による直接利用は困難です。ただし、中国市場でAIサービスを提供する場合、現地法人経由でAscendスタックを使う設計が現実的になります。米中分断の事業設計が必須です。
オンプレGPUと API利用はどちらが安いですか?
月間トークン消費が1兆超になるまではAPI利用が経済合理的です。それ以上の規模・データ主権要件・低レイテンシ要件がある場合はオンプレ or 専用クラスターが優位になります。電力・冷却・運用人材を含めたTCOで比較してください。
電力制約の解決策はありますか?
短期(2026-2027)は地域分散と再エネ電力契約、中期(2028-2030)は核融合(Helion等)・小型原子炉、長期(2030+)は光-物質コンピューティング等の物理革新が候補です。当面は「立地と電力契約の確保」が経営マターになります。
AIスタートアップはどのチップを優先すべきですか?
基本はクラウドGPU(NVIDIA)から始めるのが正解です。プロダクトのワークロードが特化(推論ヘビー、低レイテンシ、超低コスト)になった段階で、TPU / Trainium / 特化型ASIC を検討するのが現実的な進め方です。
Microsoft Maia 200はOpenAI離脱を意味しますか?
完全離脱ではなく「依存緩和」です。2032年までOpenAI排他性は維持されますが、AnthropicのCowork統合、独自MAIモデル、Maia 200で「単一ベンダーリスク」を下げる戦略です。OpenAIとMicrosoftの関係は協調と競争が併存します。
米中分断は企業のAI戦略にどう影響しますか?
中国市場向けには別系統のAIスタック(Ascend + 中国製モデル)を用意する必要があります。データ保管・モデル・推論基盤を分離設計し、コンプライアンス上も米国規制と中国規制の両方に対応した運用が必要になります。

この記事は随時更新しています。最新情報は各サービスの公式サイトでご確認ください。