読み込んだファイルを加工しましょう
それでは、読み込んだファイルを加工していきましょう。 今は週ごとの来客数を予測するための予測モデル作成(学習)用データを作成しているので、以下の加工をする必要があります。
- ふたつに分かれたファイルをひとつにまとめる(データ結合)
- 日ごとの来客数の記録を週ごとの来客数にする
これらの加工をカスタムモードをつかって実行してみましょう。
カスタムモードで加工した結果、週ごとの来店数を記録したデータが作成されます。
ステップ1
はじめに、データ結合を実行します。 「加工方法の追加」をクリックしてください。
ステップ2
Prediction Oneで実行できるデータ加工方法の一覧が表示されます。 データ結合を選択して「次へ」をクリックしてください。
ステップ3
データ結合の準備をします。
予測したい項目が含まれているファイルを選択してください。
今回の場合は、「来店数」が含まれているファイルである 1_来店数.csv
を選択し、「次へ」をクリックしてください。
ステップ4
この画面ではファイルの関係性を指定します。 今回は「日付」項目をもとにして、来店数の記録と天気予報の情報を紐づけます。 「日付」同士が結合できていることを確認して、「次へ」をクリックしてください。
ステップ5
データ結合をする際に、複数の行をどのようにまとめるかを指定します。 今回は指定を変更する必要はありませんので、このまま「次へ」をクリックしてください。
ステップ6
データ結合した結果のプレビューが表示されます。 日ごとの来店数と気温の情報が正しく結合されていることを確認してください。
今は週ごとの来店数を予測しようとしています。プレビューされている日ごとのデータを、週ごとのデータに変換しましょう。 「加工方法を追加」をクリックしてください。
ステップ7
日ごとのデータを週ごとのデータに変換する加工は「日時による集約」で行います。 「日時による集約」をクリックして「次へ」をクリックしてください。
ステップ8
データを週ごとにまとめるとき、どのようにまとめるかを指定します。 まとめる方法は、このデータを使って何を予測しようとしているかによって異なります。 今回は「週ごとの来店数」を予測したいので、以下のように設定してください。
- ①集約単位を週に指定します
- ②週ごとの来店数の合計を予測したいので、集約方法を「合計」と指定
指定をしたら「加工手順に追加」をクリックしてください。
ステップ9
「日時による集約」を実行した結果のプレビューが表示されます。 週ごとの来店数の合計がプレビューされていることを確認して、「加工手順を確定」をクリックしてください。
ステップ10
「加工手順を確定」をクリックすると、データ全体を読み込んで指定した加工手順が順番に実行されます。
このデータを使って週ごとの来店数を予測したいと思います。 「予測モデルを作成」をクリックしてください。