チュートリアルで使用するデータセット

1_来店数.csv2_天気予報.csv の中身を確認しましょう。 このチュートリアルでは、過去の来店数の記録と天気予報の記録を使って、来週・再来週の来店数を予測するという問題に取り組みます。

これらのデータセットはチュートリアル『日ごとの来客数予測による仕入れ量決定』で使用したデータとほとんど同じですが、以下の点が違います。

  • 2つのファイルを結合する必要がある
  • 日ごとの来店数が記録されていてこのままでは週ごとの来店数を予測することができない
  • 日付にはところどころ記録が欠けている

そのため、このままでは来週・再来週の来店数を予測することはできません。 来週・再来週の来店数を予測するために、カスタムモードを使って2つのファイルを1つにまとめて、さらに週毎の記録となるようにデータ加工をしましょう。

そして、2つのファイルを1つにまとめて週毎の来客数を記録したデータ(加工済みデータ)をもとに、週ごとの来客数を予測する予測モデルを作成しましょう。