こんにちは。Anagraftの伊藤です。
「つくりすぎて廃棄する」「足りなくて販売機会を逃す」。需要と供給のミスマッチは、小売・製造を問わず企業収益を蝕む構造的課題です。近年、Temporal Fusion TransformerやGoogle TimesFM、Amazon Chronos-2といった時系列基盤モデル(Time Series Foundation Model)の登場により、需要予測の精度は飛躍的に向上しています。AI需要予測ソフトウェア市場は2025年の約8.3億ドルから2035年には約20.7億ドルへと成長が見込まれ、企業のサプライチェーン変革を加速させています。
本稿では、最新の技術動向から国内企業の先端導入事例、実装上のポイントまでを網羅的に解説し、経営層・DX推進担当者の意思決定に資する情報をお届けします。
サプライチェーンを取り巻く不確実性の拡大
COVID-19パンデミック以降、サプライチェーンの脆弱性が世界的に露呈しました。半導体不足、原材料価格の高騰、物流コストの上昇、そして消費者行動の急速な変化。これらの不確実性が増す中で、従来の統計的手法(移動平均法やExponential Smoothing)に依存した需要予測では、変動の激しい市場環境に対応しきれなくなっています。
食品ロス・廃棄問題への社会的要請
日本における食品ロスは年間約472万トン(令和4年度推計)に上り、SDGsの目標12.3では「2030年までに小売・消費レベルでの食品廃棄を半減」することが求められています。需要予測の精度向上は、食品ロス削減の最も実効性の高いアプローチの一つとして注目されています。
AI需要予測市場の急成長
グローバルのAI需要予測ソフトウェア市場は、2025年の8億2,770万ドルから2035年には20億7,010万ドルへと成長が予測されています(CAGR 9.6%)。さらに、産業用AI市場全体では2024年の436億ドルから2030年には1,539億ドル(CAGR 23%)への拡大が見込まれており、需要予測はその中核的なユースケースとして位置づけられています。
PwC Japan「サプライチェーンにおけるAI活用実態調査2025」の示唆
PwC Japanグループが2025年に発表した調査によると、サプライチェーン領域でのAI活用は「一次顧客データ」の分析、すなわち需要予測やカスタマーサポートが最も活用率が高いカテゴリとなっています。一方で、データ品質・信頼性、推進体制の整備、ガバナンスの整備が「AI活用において期待を下回る理由」の上位3つに挙がっており、技術だけでなく組織的な成熟度が成功の鍵を握ることが示唆されています。
時系列基盤モデル(Time Series Foundation Model)
2024年後半から2025年にかけて、大手テック企業から相次いで時系列基盤モデルがリリースされ、需要予測の方法論に大きなパラダイムシフトが起きています。
Google TimesFMは、Googleリサーチが開発したデコーダ専用(decoder-only)のTransformerモデルで、約1,000億の実世界時系列データポイントで事前学習されています。最大の特徴は「ゼロショット予測」、すなわち対象データでの追加学習なしに、高精度な予測を即座に実行できる点です。2025年10月のアップデート(TimesFM 2.5)では、単変量・多変量・共変量対応の予測をサポートし、さらにIn-Context Fine-tuning(ICF)技術により、文脈内の少数サンプルだけでファインチューニング相当の精度を実現しています。
Amazon Chronos-2は、Amazonが2025年10月にリリースした1億2,000万パラメータのエンコーダ専用モデルで、単一アーキテクチャで単変量・多変量・共変量対応のゼロショット予測を実行できます。GIFT-EvalおよびChronos Benchmark IIにおいて、事前学習済みモデルの中で最高のパフォーマンスを達成しました。
Temporal Fusion Transformer(TFT)は、Google AI Blogが2021年に発表したアーキテクチャで、LSTMとマルチヘッドセルフアテンションを組み合わせた構造を持ちます。ゲーティング機構により変数間の関係を条件付きで学習し、可変選択ネットワーク(Variable Selection Network)を通じて「どの入力変数が予測に寄与しているか」を可視化できる点が、ビジネス現場で重宝される理由です。需要予測コンペティション(VN1 Forecasting Competition)でも高い精度を示しています。
参考として、ProphetとXGBoostを組み合わせたスタックアンサンブルによる需要予測の実装例を以下に示します。
import numpy as np
import pandas as pd
from prophet import Prophet
from xgboost import XGBRegressor
from sklearn.metrics import mean_absolute_percentage_error
# サンプル:2年分の日次売上データ
np.random.seed(42)
dates = pd.date_range("2023-01-01", periods=730, freq="D")
trend = np.linspace(100, 150, 730)
seasonality = 20 * np.sin(2 * np.pi * np.arange(730) / 365)
noise = np.random.normal(0, 5, 730)
sales = trend + seasonality + noise
df = pd.DataFrame({"ds": dates, "y": sales})
# 学習 / テスト分割(直近90日をテスト)
train = df.iloc[:-90]
test = df.iloc[-90:]
# --- Step 1: Prophet でトレンド+季節性を予測 ---
prophet_model = Prophet(yearly_seasonality=True, weekly_seasonality=True)
prophet_model.fit(train)
prophet_pred = prophet_model.predict(test[["ds"]])
prophet_forecast = prophet_pred["yhat"].values
# --- Step 2: Prophetの残差を XGBoost で補正 ---
train_pred = prophet_model.predict(train[["ds"]])
residuals = train["y"].values - train_pred["yhat"].values
# 特徴量:曜日、月、日
train_features = pd.DataFrame({
"dayofweek": train["ds"].dt.dayofweek,
"month": train["ds"].dt.month,
"day": train["ds"].dt.day,
})
test_features = pd.DataFrame({
"dayofweek": test["ds"].dt.dayofweek,
"month": test["ds"].dt.month,
"day": test["ds"].dt.day,
})
xgb_model = XGBRegressor(n_estimators=100, max_depth=3, random_state=42)
xgb_model.fit(train_features, residuals)
residual_correction = xgb_model.predict(test_features)
# --- Step 3: アンサンブル予測 = Prophet + XGBoost残差補正 ---
ensemble_pred = prophet_forecast + residual_correction
mape_prophet = mean_absolute_percentage_error(test["y"], prophet_forecast)
mape_ensemble = mean_absolute_percentage_error(test["y"], ensemble_pred)
print(f"Prophet単体 MAPE: {mape_prophet:.4f}")
print(f"アンサンブル MAPE: {mape_ensemble:.4f}")
print(f"改善率: {(mape_prophet - mape_ensemble) / mape_prophet * 100:.1f}%")
アンサンブル手法とハイブリッドモデル
単一モデルに依存するリスクを回避し、予測の安定性と精度を同時に高めるアプローチがアンサンブル手法です。
ARIMAなどの時系列回帰モデルとXGBoostなどの勾配ブースティング手法を組み合わせたスタックアンサンブルは、実務で特に高い成果を上げています。ARIMAが持つ時系列特性の捕捉力と、XGBoostの非線形関係のモデリング能力を補完的に活用することで、単独モデルに比べてMAPE(平均絶対パーセント誤差)を10〜20%改善できるケースが報告されています。
LSTM×XGBoostハイブリッドは、LSTMで時系列のトレンド・季節性成分を学習し、その残差をXGBoostで補正するアプローチです。トレンドと季節性の両方を持つ商品カテゴリにおいて、単独LSTMと比較してエラー率をさらに3.82%改善するという研究結果があります。
また、ライフサイクルの異なる製品に対して、時期に応じてモデルの重み付けを動的に変更する適応型加重アンサンブルが2025年のNature Scientific Reportsで提案されています。新商品の導入期にはシンプルなモデルの重みを高く、成熟期にはディープラーニングモデルの重みを高くするなど、製品ライフサイクルに沿った予測戦略が実現できます。
特徴量エンジニアリングと外部データ統合
需要予測AIの精度は、モデルのアーキテクチャと同等以上に「どのようなデータを入力するか」に依存します。外部データの統合として、以下のようなデータが活用されています。
多数の候補特徴量から最も予測に寄与するものを自動選択する手法として、遺伝的アルゴリズム(GA)による特徴量選択も効果を発揮しています。GAによる特徴量選択を組み込んだアンサンブルモデルは、全特徴量を投入したモデルと比較して、予測精度の向上と計算コストの削減を同時に達成します。
階層的予測(Hierarchical Forecasting)
企業全体の需要予測では、「全社から事業部、カテゴリ、SKU、店舗」といった階層構造の各レベルで整合性のある予測値が必要です。階層的予測は、各レベルで独立に予測した値を、トップダウン・ボトムアップ・最適リコンシリエーション(MinT法など)のいずれかの手法で調整し、階層間の整合性を確保します。2025年の研究動向では、階層的予測アプローチが単一レベルの予測と比較して予測誤差を9〜15%削減するという結果が報告されており、特に商品数が多い小売業や、グローバルに拠点を持つ製造業での効果が顕著です。
転移学習
新商品や新規出店など、十分な販売履歴がない状況(コールドスタート問題)に対処する手法として、転移学習が有効です。類似商品や類似店舗のデータで事前学習したモデルを、少量のターゲットデータでファインチューニングすることで、データ不足環境でも実用的な予測精度を達成できます。前述のTimesFMのIn-Context Fine-tuning(ICF)技術は、この転移学習の概念をさらに発展させたもので、数個の文脈内サンプルを与えるだけで、再学習なしにファインチューニング相当の精度を実現しています。
| 手法 | 概要 | メリット | デメリット | 適用シーン |
|---|---|---|---|---|
| 時系列基盤モデル(TimesFM, Chronos-2) | 大規模データで事前学習済みのTransformerモデル。ゼロショット予測が可能 | 追加学習なしで即時利用可能。多様な時系列パターンに対応。ゼロショットでも高精度 | 計算リソースが大きい。ドメイン固有の知識の反映が難しい場合あり。ブラックボックス性 | 多品種の一括予測、新商品・新市場の予測、PoC段階の迅速な検証 |
| Temporal Fusion Transformer(TFT) | LSTMとアテンション機構のハイブリッド。変数重要度の可視化が可能 | 高い解釈性(XAI対応)。共変量の柔軟な取り込み。マルチホライゾン予測 | 学習データの準備に手間。ハイパーパラメータ調整が必要 | 経営層への説明が必要な場面、多数の外部要因を考慮した予測 |
| アンサンブル手法(スタック、加重平均) | 複数モデルの予測を統合 | 個別モデルより安定・高精度。モデル選択のリスク分散 | 運用・保守の複雑化。計算コスト増大 | 精度が最優先の業務、季節性・トレンドが複合する商品群 |
| 階層的予測(Hierarchical Forecasting) | 組織階層の各レベルで整合性のある予測を生成 | 階層間の整合性確保。予測誤差9〜15%改善 | 実装の複雑性。階層構造の設計が必要 | 多階層の組織、SKU数が多い小売業、グローバル拠点を持つ製造業 |
| 転移学習・ゼロショット | 事前学習モデルを少量データで適応 | コールドスタート対応。学習データが少なくても高精度 | ソースドメインとの類似性に依存。適切な事前学習モデルの選定が必要 | 新商品投入時、新規出店、新規市場参入 |
| 従来型統計手法(ARIMA, Exponential Smoothing) | 時系列の自己相関構造に基づく予測 | 解釈性が高い。計算が軽量。導入が容易 | 非線形パターンへの対応が弱い。外部要因の取り込みが限定的 | 安定した需要パターンの商品、ベースラインモデル |
セブン-イレブン・ジャパンの事例
背景: 全国約21,000店舗で膨大な品目を取り扱うセブン-イレブン・ジャパンでは、各店舗の発注業務に多大な時間を要しており、品切れによる販売機会ロスの低減と発注業務の効率化が課題でした。
技術: 2020年1月から一部店舗でAI発注システムの運用を開始し、2023年3月から全国約21,000店舗への本格展開を進めています。システム基盤にはGoogle Cloud(BigQuery)を採用し、天候、曜日特性、地域イベント、過去の販売実績といった多次元データをAIが分析して、各店舗に最適な発注数量を自動提案します。さらに2025年8月をメドに、13種類の大規模言語モデル(LLM)を使い分けられる生成AI基盤「AIライブラリー」を約8,000人の全社員に展開しており、需要予測だけでなく業務全般のAI活用を加速しています。
成果: 1日あたりの発注時間を最大40%(約35分)削減しました。品切れ(販売機会ロス)の低減と品揃えの最適化を実現し、Google CloudのBigQuery MLとLooker Studioの活用により、AIモデルの改善サイクルが高速化されています。店舗スタッフは発注業務から解放され、品揃えの見直しや売場づくりに時間を充当できるようになりました。
イオンリテールの事例
背景: 国内最大規模の小売チェーンとして、需要予測の精度向上による在庫最適化と食品ロスの削減が経営上の重要課題でした。消費期限が近づいた商品の値引き業務にも多くの人的リソースが割かれていました。
技術: イオンリテールは日本IBMと共同で、国内最大規模の需要予測・発注システム「AIオーダー」と、AIが最適な値引き率を算出する「AIカカク」を開発・展開しています。AIオーダーは客数予測と商品別の需要予測を統合し、各店舗の最適な発注数量をAIが提示します。AIカカクは消費期限が近づいた商品に対してAIが売り切り価格を算出し、食品ロスと値引きロスの両方を最小化します。2024年5月からはAIカカクの適用を畜産・水産部門に拡大し、AIオーダーも日配品・デリカ(冷総菜・サラダ)へと対象カテゴリを広げています。
成果: 既存システム比で予測精度が最大40%改善されました。発注時間を平均50%削減、在庫量を平均30%削減しています。AIカカク導入後はロス率が1割以上低減し、値引き・売り切り業務の店舗スタッフ教育時間も削減されています。
ファーストリテイリング(ユニクロ)の事例
背景: ファーストリテイリングは「情報製造小売業」への変革を掲げ、製販一体型の経営を支える高精度な需要予測システムの構築が求められていました。シーズン切り替え時の売れ残りや機会損失の低減も重要な課題でした。
技術: 全社改革「有明プロジェクト」において、AIと機械学習を活用した需要予測システムをGoogleのグローバルAIチームと共同で構築しています。過去の販売データに加え、天候、経済指標、ソーシャルメディアのトレンドなど多様な外部データをAIが分析し、商品ごと・店舗ごとの需要を高精度に予測しています。この需要予測は数量計画の精緻化やサプライチェーンのリードタイム短縮と連動しており、「つくりすぎない・届けすぎない」製販一体型の経営を支えています。
成果: 在庫回転率が2.5回転から3.1回転へ改善されました(約24%向上)。値引き率の大幅な改善、売れ残り数量の大幅な削減、シーズン切り替えのスムーズ化による機会損失の低減を実現しています。
スシローの事例
背景: 回転寿司チェーンでは、レーンに流すすしの量が多すぎれば廃棄が増え、少なすぎれば顧客満足度が低下するという、極めてシビアな需要予測が求められていました。
技術: スシローは年間10億件に上る「すし皿ビッグデータ」を蓄積・分析し、日付、天候、来客パターンなどのデータと組み合わせた需要予測AIを構築しています。AIの予測に加えて、店長の長年のノウハウも需要予測モデルに取り入れるハイブリッドアプローチを採用している点が特徴です。
成果: 廃棄量を従来の4分の1(75%削減)に圧縮することに成功しました。売上の向上と食品ロス削減を同時に実現し、「人間の知見×AIの分析力」のハイブリッドモデルの有効性を実証しています。
データ基盤の整備が最優先
需要予測AIの精度は「入力データの品質」に最も大きく依存します。多くの企業ではPOSデータの欠損・異常値の処理、商品マスターの整備、外部データ(天候・イベント)との結合基盤の構築が必要です。まずはデータウェアハウス(DWH)やデータレイクの整備から着手することが推奨されます。
スモールスタートと段階的展開
全商品・全店舗で一斉導入するのではなく、売上インパクトの大きい主力カテゴリ(ABC分析のAランク商品など)から始め、効果を実証してから対象を拡大する段階的アプローチが成功の確率を高めます。イオンリテールのAIオーダーも、日配品から畜産・水産・デリカへと段階的に適用範囲を拡大しています。
説明可能性(XAI)の確保
経営層や現場担当者にとって、「なぜその予測値になったのか」を説明できることは導入の受容性を左右する重要な要素です。TFTの変数重要度可視化や、SHAPなどの説明可能AI技術を組み込むことで、予測のブラックボックス化を防ぎ、現場の信頼を獲得できます。
人間とAIの協調設計
セブン-イレブンのAI発注システムは「AIの提案を人間が最終判断する」設計であり、スシローは「店長の知見をAIモデルに統合」しています。AIの予測値を鵜呑みにするのではなく、現場の知見を組み合わせるヒューマン・イン・ザ・ループ(Human-in-the-Loop)のアプローチが、実務では最も高い成果を上げています。
コールドスタート問題への対策
新商品や新規出店では、十分な販売履歴が存在しません。この「コールドスタート問題」に対しては、以下の対策が有効です。
在庫最適化との統合
需要予測は「予測して終わり」ではなく、安全在庫の動的計算や発注最適化と連携してこそ真価を発揮します。AIベースの需要予測と在庫管理を統合したシステムでは、在庫保持コストが15〜22%削減、欠品率が30〜45%減少するという実績が報告されています。
生成AIとの融合
生成AIは単なるパターン認識を超え、「もし特定の事象が起きたら需要はどう変化するか」というシナリオシミュレーションを自然言語で実行する能力を持ちます。2027年までに生成AIソリューションの40%がマルチモーダル(テキスト・画像・音声・動画の同時処理)対応になると予測されており、発注履歴、顧客フィードバック、商品写真、倉庫画像を統合的に分析する次世代の需要予測が現実味を帯びています。
AIエージェントによる自律型サプライチェーン
需要予測AIの次なる進化形は、「予測」から「自律的な意思決定」への拡張です。AIエージェントが需要の変動をリアルタイムに感知し、発注数量の調整、安全在庫の再計算、サプライヤーへの発注タイミングの最適化を自律的に実行する「自律型サプライチェーン」の構想が、2025〜2026年にかけて急速に具体化しています。
時系列基盤モデルの民主化
TimesFMやChronos-2がオープンソースで公開されていることは、大企業だけでなく中堅・中小企業にとっても需要予測AIへのアクセス障壁を大幅に引き下げています。今後はこれらの基盤モデルをベースとしたSaaS型の需要予測プラットフォームが普及し、技術的な専門知識がなくても高精度な需要予測を利用できる時代が到来すると見込まれます。
リアルタイム需要センシング
IoTセンサー、棚札の電子化、カメラによる来店客数のリアルタイム計測など、店舗のデジタル化が進むことで、「日次・時間帯別」を超えた「リアルタイム」の需要予測が可能になりつつあります。これにより、品出しのタイミング最適化やダイナミックプライシングとの連動など、よりきめ細かいオペレーション最適化が実現します。
需要予測AIは、従来の統計的手法からTransformerベースの基盤モデルへと技術的な転換期を迎えています。Google TimesFMやAmazon Chronos-2に代表される時系列基盤モデルのゼロショット予測能力は、「データがなくても予測できる」という新たな可能性を切り開きました。
国内では、セブン-イレブンの発注時間40%削減、イオンの予測精度40%改善と在庫30%削減、ファーストリテイリングの在庫回転率24%向上、スシローの廃棄量75%削減といった具体的成果が、需要予測AIの投資対効果を明確に実証しています。
重要なのは、需要予測AIを「魔法の杖」として捉えるのではなく、データ基盤の整備、スモールスタートによる段階的展開、説明可能性の確保、人間とAIの協調設計という地道なプロセスを着実に進めることです。自社のサプライチェーンのどこにボトルネックがあり、どの予測手法が最も適しているのかを見極めた上で、戦略的にAI投資を進めていくことが、経営層・DX推進担当者に求められる最初の一歩です。