Nvidia Vera chipが生成AIコストをどう変える

Nvidia’s Vera chip is the US$200 billion bet Jensen Huang doesn’t want you to overlook

【この記事の注目ポイント】

  • Nvidiaは2026年第1四半期売上816.2億ドル、翌四半期見通し910億ドルを示しつつ、Veraで2000億ドル市場を狙う構図です
  • 計算需要が「学習中心」から「推論中心」へ移る中、日本企業もGPU調達だけでは設計不足になります
  • 供給制約がすでに語られており、ハードウェア競争は性能よりも供給網と用途最適化へ移っています
目次

決算よりもVeraに目を向けるべき理由

あなたの会社でも、AI導入の議論がGPUの性能比較で止まっていないでしょうか。実際の現場では、モデル学習よりも「回答を何万回、何十万回さばけるか」が先に問題になります。今回のNvidiaの決算で市場が最初に見たのは、売上816.2億ドルと翌四半期見通し910億ドルでしたが、私が重要だと感じたのはそこではありませんでした。Jensen Huang氏がVera chipで2000億ドル市場を狙うと明言した点こそ、事業の次の主戦場を示しています。つまり、NvidiaはGPU一本足ではなく、推論向けの別の稼ぎ柱を作りに行っています。推論とは、学習済みAIが実際に答えを返す処理であり、エージェント時代には最も回数が増える領域です。

Vera chipが狙う推論市場と供給制約

Nvidiaは2026年第1四半期の売上を816.2億ドルと発表し、アナリスト予想の788.6億ドルを上回りました。ここでの差は約27.6億ドルであり、予想比で約3.5%上振れした計算です。この数字は、単なる「好調」の一言では片づきません。市場が127億ドル規模の差でなく、既に2桁成長を前提に見ている中で、Nvidiaがさらに上を出してきたという意味を持ちます。さらに第2四半期の見通しを910億ドルと示し、ウォール街の868.4億ドル予想を大きく上回りました。差は41.6億ドルで、約4.8%の上振れです。こうした継続的な上方修正は、需要が一時的な熱狂ではなく、実需として積み上がっている証拠です。

ただし、より大きい話はVeraです。Huang氏はVeraが2000億ドルの市場を開くと説明し、その売上が今期末までに200億ドルへ達する見通しを示しました。200億ドルは2000億ドル市場の10%に相当し、立ち上げ初年度から相当な存在感を持つ水準です。しかもこの市場は、Nvidiaが事前に見込むBlackwellとRubinのAI GPUラインでの1兆ドル規模の見通しとは別枠です。ここが重要で、VeraはGPUの代替ではなく、GPUを売る理由を増やすためのCPUです。CPUとは中央演算処理装置であり、AIサーバー内ではデータの受け渡しや推論処理の制御を担います。Nvidiaがここを押さえることで、システム全体をまとめて販売する力を強めます。

背景には、Google、Amazon、Microsoftといった巨大クラウド事業者が、年間7000億ドル超をAIインフラに投じつつ、自社専用半導体も増やしている現実があります。私はこの点にこそNvidiaの焦りと先手を読みます。学習用途ではGPUが強いままでも、推論用途ではGoogleのTPU、AmazonのTrainium、さらにはAMDやIntelのCPU系提案が競争力を持ち始めています。推論は1回あたりの処理コストが差別化要因であり、ここで勝つには性能だけでなく電力効率、供給安定性、ソフトウェア最適化が必要です。Huang氏が「Vera Rubinの寿命を通じて供給制約が続く」と述べたのは、需要があるから安心ではなく、需要をさばけない危険も抱えるという宣言に等しいです。

実際、Nvidiaの供給コミットメントはQ1に1190億ドルへ膨らみ、前四半期の952億ドルから大きく増えました。差は238億ドルで、これは供給網に前倒しで資金を積んでいることを示します。ハードウェア企業がここまで供給を先に張るのは、需要予測が鈍れば在庫リスクが即座に利益を圧迫するからです。つまりVeraは市場獲得の話であると同時に、供給網の勝負でもあります。読者の立場で言えば、AI基盤の導入計画を立てる際に「最新GPUが買えるか」だけでなく、「推論を継続運用できるか」を見なければなりません。

日本企業が見直すべきAI基盤の発想

日本企業にとって、このニュースの実務的な意味ははっきりしています。生成AIをPoCで終わらせず、社内問い合わせ、営業支援、設計レビュー、コールセンター補助まで広げるほど、学習コストより推論コストが重くなります。ここでVeraのような推論重視の製品が伸びると、導入の評価指標も変わります。たとえば「モデル精度」だけでなく、「1,000回あたりの応答コスト」「同時接続時の遅延」「月次のGPU・CPU稼働率」を見ないと、運用費を読み違えます。現場の担当者なら、一度は見積もりが想定より膨らんだ経験があるはずです。その原因は、学習費よりも推論の常時稼働が効いているケースが多いです。

私は今回のVera発表を、Nvidiaが「AIは作る時代」から「使い続ける時代」へ移ったことへの回答と解釈しています。日本の開発組織なら、GPUサーバーを増やす発想だけでなく、エージェントの実行回数を減らすキャッシュ設計、検索精度の改善、RAGの検索範囲縮小など、推論回数そのものを減らす工夫が必要です。RAGは外部文書を参照して回答精度を上げる方式ですが、検索が重ければコストも上がります。つまり、ハードウェア投資とアーキテクチャ設計は一体です。Veraが伸びる世界では、AI基盤の競争は「何を学習したか」より「何を安く速く返せるか」に移ります。

GPU中心の勝負から推論基盤の競争へ

今後の焦点は、Veraが本当に200億ドル規模の売上を立ち上げられるか、そして供給制約をどこまで解消できるかです。ここで失速すれば、Nvidiaの成長物語はGPU依存に戻ります。一方で立ち上がりが早ければ、AIエージェントや業務用生成AIの普及は、CPU・GPU・ソフトウェアを束ねた基盤競争へ完全に移ります。私は、この流れが日本企業の調達方針にも直結すると見ています。価格交渉の対象は単体GPUではなく、推論コスト全体へ移るからです。

編集部コメント

正直に言うと、今回いちばん引っかかったのは「Veraが控えめに扱われているのに、中身はかなり大きい」という点です。決算の売上だけを見るとまたNvidiaの勝ち、で終わりますが、実際には推論市場を取りに行くための二番手ではなく、次の本命を作る動きです。日本の現場でも、GPU争奪戦だけを見ていると一歩遅れます。推論の単価、供給、実装設計まで入れて考えるべき局面に入っています。

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

コメント

コメントする

目次