この記事ではLLMに特化して解説します。LLM全般は LLMとは?仕組みからローカル実行まで徹底解説【2026年完全ガイド】 をご覧ください。
何が起きたか
メモリチップ企業の株価が急速に下落し、100億ドルを超える時価総額が消失した。従来AIブームによる供給不足と需給逼迫が継続するとの市場予想が大きく修正された。実際には供給が徐々に正常化し、AI関連需要の過度な先行き期待が調整局面に入った。
特にDRAMとNAND型フラッシュメモリを製造する主要企業の株価が2桁のパーセンテージで下げている。影響を受けた主な企業はSamsung、SK Hynix、米国のMicron Technologyの3社で、合わせると世界のDRAM生産量の90%以上を占める。
この調整は単純な「AI需要の消滅」ではない。構造的な変化として、AI推論モデルの効率化と製造キャパシティの正常化が同時進行した結果だ。エンジニアの視点では、むしろ調達環境が好転する転換点として注目に値する。
AI需要サイクルとメモリ市場の構造
AI需要急増初期には、GPU向けメモリ需要が供給を大幅に上回り、納期延長と価格上昇が続いた。この状況は投機的なロングポジション形成と株価上昇を促進した。
ChatGPT登場
AI需要急増"] --> B["GPU増産ラッシュ
NVIDIA H100争奪戦"] B --> C["HBM/DRAM不足
納期6〜12ヶ月待ち"] C --> D["メモリ価格急騰
株価上昇(투기的ロング)"] D --> E["2024年〜
製造ライン増設完了"] E --> F["AI推論効率化
小型モデルへのシフト"] F --> G["需給バランス反転
機関投資家の利確"] G --> H["株価急落
100億ドル超の時価総額消失"] H --> I["エンジニア視点:
調達コスト低下・納期改善"]
2024年中盤以降、主要メモリメーカーが増産ラインを稼働させ、業界全体の供給キャパシティが急増した。同時にAI推論ワークロードの効率化(より小さいモデルへのシフト)も進み、メモリ単価の値上がり期待が反転。機関投資家による利益確定売却とテクニカルな売り圧力が重なり、急落局面へと移行した。
HBM(高帯域幅メモリ)とAIシステムへの役割
AI向けメモリの中でも特に注目されるのが HBM(High Bandwidth Memory) だ。HBMはGPU(特にNVIDIA H100/H200シリーズ)のダイに直接積層され、一般的なGDDR6に比べて数倍〜数十倍の帯域幅を実現する。
大規模言語モデルの推論では、モデルの重み(パラメータ)を高速にメモリから読み出す「メモリバウンド」なワークロードが多い。GPT-4クラスの1750億パラメータのモデルをFP16精度で保持するには約350GBのメモリが必要で、複数GPU間の高速データ転送にHBMが不可欠だ。
# AI推論システムのメモリ帯域幅計算例
# GPU メモリ帯域幅の推定と必要スループット
def calc_memory_bandwidth_requirement(
model_params: int, # パラメータ数
precision_bytes: int, # FP16=2, FP32=4, INT8=1
tokens_per_second: int, # 目標生成速度
batch_size: int = 1
) -> dict:
"""
LLM推論のメモリ帯域幅要件を計算する
"""
model_size_gb = (model_params * precision_bytes) / (1024 ** 3)
# 1トークン生成あたりのメモリ読み出し量(近似)
# Transformer: 1 forward passで全パラメータを約2回アクセス
bytes_per_token = model_params * precision_bytes * 2
# 必要帯域幅 (GB/s)
required_bandwidth_gbs = (bytes_per_token * tokens_per_second * batch_size) / (1024 ** 3)
return {
"model_size_gb": round(model_size_gb, 1),
"required_bandwidth_gbs": round(required_bandwidth_gbs, 1),
"tokens_per_second": tokens_per_second
}
# 例: Llama 3 70B (FP16) で 30トークン/秒を目標
result = calc_memory_bandwidth_requirement(
model_params=70_000_000_000,
precision_bytes=2, # FP16
tokens_per_second=30
)
print(f"モデルサイズ: {result['model_size_gb']} GB")
print(f"必要帯域幅: {result['required_bandwidth_gbs']} GB/s")
# 出力例: 必要帯域幅: 7800 GB/s → 高帯域幅メモリが不可欠な理由
# 参考: H100 SXM HBM3の帯域幅は 3.35 TB/s
# 実際には4〜8基のH100を並列使用することが多い
メモリ種別とAIユースケースの比較
AIシステムに使われるメモリにはいくつかの種別があり、それぞれ異なる役割を担っている。
| メモリ種別 | 代表製品 | 帯域幅 | 容量 | 主なAIユースケース |
|---|---|---|---|---|
| HBM3E | SK Hynix HBM3E Samsung HBM3E |
1.2 TB/s(1スタック) | 24〜36 GB(1スタック) | H100/H200 GPU、大規模LLM推論・学習 |
| GDDR7 | Micron GDDR7 | 1.5 TB/s | 24〜32 GB | 次世代GPU(RTX 5090等)、ミッドレンジ推論 |
| LPDDR5X | Samsung LPDDR5X | 77 GB/s | 16〜64 GB | オンデバイスAI、スマートフォン推論 |
| DDR5 ECC | 各社 | 76 GB/s | 128〜1536 GB | CPU推論、大容量コンテキスト処理 |
| NAND(SSD) | 各社 NVMe | 7〜14 GB/s(PCIe5) | 数 TB | モデルウェイトオフロード、データセット |
HBM3Eは現世代で最も高価かつ供給が限られるメモリだが、今回の供給正常化の波はHBM3E以外の汎用DRAM・NANDにより強く現れている。HBM3E自体はNVIDIA Blackwellアーキテクチャ向けに引き続き需要が旺盛だ。
価格下落がAIインフラ設計に与える実際の影響
# サーバー構成コスト試算の変化(概算例)
# 2023年ピーク時 vs 2025年現在
# 8x NVIDIA H100 SXM 推論サーバー(DDR5 + NVMe構成)
# ピーク時(2023年Q3推定)
H100_x8=320000 # USD(1枚 $40,000)
DDR5_512GB=8000 # USD(512GB ECC DDR5)
NVME_4TB=3000 # USD(4TB NVMe SSD x2)
TOTAL_PEAK=$((H100_x8 + DDR5_512GB + NVME_4TB))
echo "2023年ピーク時: $${TOTAL_PEAK} USD" # $331,000
# 2025年現在(メモリ・ストレージ価格正常化後)
H100_x8=200000 # 依然高価だがスポット市場で緩和
DDR5_512GB=4000 # 約50%下落
NVME_4TB=1200 # 約60%下落
TOTAL_NOW=$((H100_x8 + DDR5_512GB + NVME_4TB))
echo "2025年現在: $${TOTAL_NOW} USD" # $205,200 (約38%削減)
# メモリ・ストレージだけで年間コスト換算で数百万円規模の差
実際のシステム構築コストへの影響として注目すべきポイントがある。
- 調達コスト低下: DDR5やNVMe SSDの価格が2023年ピーク比で30〜60%程度下落。AI推論クラスターの初期投資が削減される
- 納期改善: かつての納期数ヶ月待ちが解消し、短納期調達が実現化。プロジェクト計画が立てやすくなった
- 仕様選択の自由度向上: 供給余裕により、用途に応じた最適なメモリ仕様を柔軟に選定可能に
- エッジAI設計の余裕: メモリ価格の相対的な低下で、エッジデバイス向けのメモリ削減圧力が軽減
メモリ価格の正常化は「今がAIインフラ投資のタイミング」を意味する可能性がある。ただしHBM3/3Eを搭載するハイエンドGPUサーバーは依然として需要が旺盛で価格は高止まりしている。コスト最適化の観点では、(1) 汎用DRAM・NVMeを使うCPU推論クラスター、(2) 量子化モデル(INT8/INT4)によるGPUメモリ削減、(3) クラウドスポットインスタンスとのハイブリッド構成、の3つを組み合わせるアプローチが現実的だ。
各社の現状と市場ポジション
| 企業 | 主力製品 | HBM競争力 | 調整局面の影響 |
|---|---|---|---|
| SK Hynix | DRAM・NAND・HBM3E | 最強: NVIDIA H100/H200向けHBM3E独占供給 | 汎用DRAMは下落、HBM3Eは需要堅調 |
| Samsung | DRAM・NAND・HBM3 | HBM品質問題からの回復中 | 最大手ゆえに汎用DRAM下落の影響が最大 |
| Micron Technology | DRAM・NAND・HBM3E | 北米唯一の大手、CHIPS法補助金対象 | 供給正常化で価格競争激化 |
SK HynixはNVIDIA向けHBM3Eの優先サプライヤーとしての地位を確立しており、AI学習・推論需要が旺盛な限り差別化が維持される。一方でSamsungは品質問題(歩留まり低下)によってHBM市場でのシェアを奪われた経緯があり、回復が課題となっている。
Apache Airflow のようなデータパイプライン基盤の整備と並行して、AIインフラのコスト管理戦略を見直す好機でもある。
関連記事: LLMとは?仕組みからローカル実行まで徹底解説【2026年完全ガイド】