ジャンプ先

時系列予測とは

時系列予測は、統計的または機械学習的なアプローチの一種であり、将来の時系列を予測するために過去の時系列データをモデル化しようとするものです。

時系列予測の課題

他のタイプのモデルと比較して、時系列予測には、季節性、休日効果、データスパース性、トレンドの変化などの独自の課題があります。時系列の特性と時間的相関のため、多くの機械学習手法はここではうまく機能しません。たとえば、k 折り交差検証はデータ漏洩を引き起こす可能性があります。新しい予測を生成するには、モデルを再トレーニングする必要があります。過学習と適合不足のバランスを取るのは、時間のディメンションをランダム化できない困難な作業です。予測する項目が数百万個になると、予測ソリューションのスケーラビリティも考慮する必要があります。 予測だけでなく、異常検出、不確実性の定量化、因果推論などのタスクがビジネスにとって重要な場合があります。時系列予測は、タイムスタンプ付きのデータに対する教師あり学習だけではありません。幸いなことに、Google Cloud はあらゆるビジネスニーズに対応した幅広いソリューションを提供します。

たとえば、大規模な小売店では、需要が高いときに在庫を確保し、需要が低いときに過剰在庫にならないように、数百万のアイテムを予測する場合があります。

時系列予測のユースケース

需要予測とキャパシティ プランニング

商品の小売需要予測

小売商品の需要を予測するエンドツーエンドのソリューションを構築します。過去の販売データを使用し、BigQuery ML を使用して需要予測モデルをトレーニングします。その後、Looker Studio ダッシュボードで予測値を可視化して関係者と共有します。Google の需要予測リファレンス パターンで、Google Cloud で数百万のプロダクトへのスケーリングが可能な需要予測ソリューションを構築する方法を説明します。 また、リファレンス パターンでは、需要予測で食品廃棄物を減らす方法についても説明します。

商品価格予測

時系列モデルは、ビジネス プロセスと生産プロセスにとって重要な商品価格の予測や、キャッシュフロー モデルと財務計画への通知に使用されます。

キャッシュフローの予測

一般的に、時系列モデルは回帰モデルおよび分類モデルと組み合わされ、過去の会計時系列および取引データおよび契約上の義務からの入力に基づいて、高精度のキャッシュフロー予測を生成します。ここでは、ARIMA_PLUS を BigQuery ML とともに使用して、GLM、ブーストツリー モデル、AutoML などの BigQuery ML の教師ありモデルと組み合わせることができます。

異常検出

需要予測を使用した異常検出

祝日や贈り物の時期、年末のセールなどに、利用額が増えることが予想されます。 しかし、予想外の急増(または谷)がある場合にはどうすればよいでしょうか。たとえば、予想外に高い(あるいは低い)需要を発見するにはどうすればよいでしょうか。BigQuery ML で異常を検出して、自転車レンタルの異常な急増を検出する方法を確認します。これは、ロンドン市で公共交通機関の運行が中断された日と一致します。

製造品質管理と指標モニタリング

IoT センサーから本番環境への出力まで、指標のモニタリングには多くの形があります。ただし、一般的な要素は、これらの指標の一般的な範囲を予測するため、モニタリング システムを導入して、可能な限り早期に計画を立て、対応できます。

異常検出のその他の一般的なユースケースには、価格設定の誤り、リアルタイムの異常検出、製造品質管理による価格異常などがあります。

因果推論

広告の効果

広告がビジネスの増加にどの程度効果的だったか。因果推論を使用すると、広告キャンペーンの統計的有意性を確認できます。

主要なイベントが時系列に及ぼす影響

英国の EU 離脱などの主要なイベントが時系列に与えた影響が統計的に有意かどうかを知りたい場合があります。 因果推論により「英国の EU 離脱後の投票が英国ポンドと米ドルの為替レートにどう影響したか」を確認する方法をご覧ください。

因果推論分析の他の領域には、プロモーション、インセンティブ効果、価格弾力性の推定があります。

Google Cloud での時系列予測

BigQuery ML

BigQuery ML を使用すると、BigQuery で標準 SQL クエリを使用して機械学習モデルを作成して実行できます。ARIMA_PLUS というモデルタイプをサポートし、時系列予測タスクと異常検出タスクを実行します。

BigQuery ML の ARIMA_PLUS モデリングを使用すると、データ ウェアハウスから移動することなく、1 つの SQL クエリ内で数百万の時系列の予測を行うことができます。

ARIMA_PLUS は基本的に、時系列モデリング パイプラインであり、次の機能が含まれます。

  • 時系列のデータ頻度を推定する
  • 欠損データ、不規則な時間間隔、重複するタイムスタンプの処理
  • 急上昇や急降下の外れ値と急激なレベル変化を検出して調整する
  • 祝日の効果、季節性、トレンドを処理する

1 つのクエリで数千万件の時系列を一度に予測できます。十分な BigQuery スロットが使用可能であれば、異なるモデリング パイプラインが並行して実行されます。

BigQuery ARIMA_PLUS は、以下のチュートリアルからご利用いただけます。

詳細については、BigQuery ML の公開ドキュメントをご覧ください。

Vertex Forecast

Vertex Forecast には、時系列予測モデルをトレーニングするための複数のオプションが用意されています。

  1. AutoML モデル。AutoML のトレーニングでは、最初にさまざまな特徴量エンジニアリングのアプローチが適用され、高速のハイパーパラメータ検索が実行され、AutoML で Google 所有のモデルを含む多くの高度なモデル アーキテクチャが探索され、最終的に高品質なモデルを生成します。
  2. Seq2seq プラス。トレーニング プロセスでは、特にシーケンス間モデル アーキテクチャのハイパーパラメータが使用されます。これにより、ハイパーパラメータ検索スペースのスコープを縮小し、迅速な収束を実現できます。

詳細については、Vertex Forecast の公開ドキュメントをご覧ください。

Vertex Forecasting のチュートリアルを開始できます。

カスタム予測

独自のカスタムコードを持ちながら Google Cloud でトレーニング/サービング インフラストラクチャを活用する場合は、Vertex AI Workbench を使用して、Python、R、TensorFlow、PyTorch のコードを実行できます。

一変量と多変量の予測

一変量予測では、過去の時系列データのみを使用して将来のデータを予測します。たとえば、ニューヨーク市の明日の気温を予測する場合、一変量予測では、将来の気温を予測するために 1 つの変数の過去の気温のみを使用することになります。一変量予測を使用すると、季節的なパターンや傾向も把握できます。

多変量予測では、複数の要素を使用して将来のデータを予測します。たとえば、ニューヨーク市の明日の気温を予測する場合、過去の気温に加えて、気圧、UV インデックス、付近の地理的範囲に対する雲のカバー率、風速、その他の変数も使用します。

Google Cloud のソリューションを活用してみませんか。課題をともに解決しましょう。

Google Cloud で組織の予測を変革する方法をご覧ください。
お問い合わせ
実践演習を行って、時系列予測の Codelab を今すぐお試しください。
Codelab を見る

BigQuery ML が組織にどのように役立つかをご覧ください。 ドキュメントを見る

Google は、運用トランザクションの実行から、データ ウェアハウスとデータレイク全体の分析アプリケーションの管理、サイロを解消する豊富なデータドリブンのエクスペリエンスまで、データ ライフサイクルのあらゆる段階を管理する機能を提供します。人工知能 / 機械学習はデータクラウド ソリューションのコア コンポーネントです。これにより、組織は分析情報の改善だけでなく、データを中核として使用して中核となるビジネス プロセスを自動化できます。