BigQueryMLのWebアクセス将来予測のプログラムは、どの程度の予測か?
所長のBlogの「Webアクセス将来予測をAIを使って、将来予測をしよう」で、Google Cloudが用意する、BigQueryを使って、Google Analytics(GA4)のデータから、Webサイトの将来の予測を行うプログラム(SQL)を公開しました。
私もこのBlogを書きながら、一緒に体験しています。そして、プログラム開発後、予測に必要な過去のデータもかなり溜まってきたので、ここからは、実際に予測が、どの程度、実際のサイトの数値に近いのか、公開してみようと思います。
BigQueryMLの将来予測公開実験で知りたいこと
今回の公開実験で皆さんと確認したいことは、
過去のデータの「数」と予測の関係
Webのアクセス数予測に、過去のページビューと、カレンダーしか考慮していないが、それでも使える予測なのか
という2点です。
今回は、過去データ53日間
使った私のサイト、つまりこのサイトのアクセス分析データを公開しておきます。実際に、アクセス分析データを使えない方も、このデータを参考に将来予測モデルを作ることができますよね。
date | page view | date | page view | date | page view | ||
2024/08/01 | 117 | 2024/09/01 | 67 | ||||
2024/08/02 | 91 | 2024/09/02 | 111 | ||||
2024/08/03 | 58 | 2024/09/03 | 94 | ||||
2024/08/04 | 67 | 2024/09/04 | 144 | ||||
2024/08/05 | 73 | 2024/09/05 | 196 | ||||
2024/08/06 | 78 | 2024/09/06 | 139 | ||||
2024/08/07 | 86 | 2024/09/07 | 47 | ||||
2024/08/08 | 118 | 2024/09/08 | 51 | ||||
2024/08/09 | 73 | 2024/09/09 | 105 | ||||
2024/08/10 | 32 | 2024/09/10 | 168 | ||||
2024/08/11 | 33 | 2024/09/11 | 108 | ||||
2024/08/12 | 50 | ||||||
2024/08/13 | 52 | ||||||
2024/08/14 | 46 | ||||||
2024/08/15 | 37 | ||||||
2024/08/16 | 41 | ||||||
2024/08/17 | 38 | ||||||
2024/08/18 | 47 | ||||||
2024/08/19 | 132 | ||||||
2024/08/20 | 102 | ||||||
2024/07/21 | 4 | 2024/08/21 | 144 | ||||
2024/07/22 | 144 | 2024/08/22 | 231 | ||||
2024/07/23 | 107 | 2024/08/23 | 104 | ||||
2024/07/24 | 69 | 2024/08/24 | 35 | ||||
2024/07/25 | 61 | 2024/08/25 | 55 | ||||
2024/07/26 | 165 | 2024/08/26 | 190 | ||||
2024/07/27 | 36 | 2024/08/27 | 230 | ||||
2024/07/28 | 44 | 2024/08/28 | 259 | ||||
2024/07/29 | 398 | 2024/08/29 | 233 | ||||
2024/07/30 | 200 | 2024/08/30 | 249 | ||||
2024/07/31 | 165 | 2024/08/31 | 81 |
将来の予測は?
上記のデータを使って、BigQueryMLの中にある、ARIMA PLUSというモデルを使って、時系列予測を行なっています。
参考:BigQueryMLのARIMA+ による予測
BigQueryMLのARIMA PLUSの主な特徴は以下になります。
時系列データの分析と予測に特化したモデルです。
季節性、トレンド、周期性などの複雑なパターンを捉えることができます。
外生変数(exogenous variables)を組み込むことができ、予測精度の向上が期待できます。
自動的にモデルのパラメータを最適化します。
BigQueryの大規模データ処理能力を活用し、大量のデータを効率的に処理できます。
今回の予測では、外生変数は、何も入れていません。
さて、将来予測の公開です。数日後、この実際のデータも所長のBlogで発表しますので、少々お待ちください。
date | predicted_pageviews |
---|---|
2024/09/12 | 161.2 |
2024/09/13 | 130.0 |
2024/09/14 | 51.2 |
2024/09/15 | 22.9 |
2024/09/16 | 112.6 |
2024/09/17 | 125.8 |
2024/09/18 | 146.1 |
2024/09/19 | 192.4 |
2024/09/20 | 125.0 |
2024/09/21 | 36.0 |
2024/09/22 | 42.1 |
2024/09/23 | 110.0 |
2024/09/24 | 123.9 |
2024/09/25 | 148.5 |
2024/09/26 | 200.8 |
2024/09/27 | 125.3 |
2024/09/28 | 32.7 |
2024/09/29 | 39.5 |
2024/09/30 | 107.4 |
2024/10/01 | 122.0 |
2024/10/02 | 150.8 |
2024/10/03 | 209.2 |
2024/10/04 | 125.6 |
2024/10/05 | 29.4 |
2024/10/06 | 36.8 |
2024/10/07 | 104.8 |
2024/10/08 | 120.1 |
2024/10/09 | 153.2 |
2024/10/10 | 217.6 |
2024/10/11 | 125.9 |
さぁ、どの程度の予測精度のなのか、私も楽しみに待ちたいと思います。
Commenti