HOME > ブログ > スムーズな予測分析への道【データ準備編】
スムーズな予測分析への道【データ準備編】
#3分でわかる!プレワンの話
Prediction One通称「プレワン」。このブログシリーズでは、まだまだ知られていないプレワンの特長を投稿していきます。
第3回目は、予測分析において必要不可欠な
「データ準備」についてご紹介
3回目の本日は、予測分析において必要不可欠な「データ準備」についてです。データ準備の際にぶつかる壁と解決のヒントについて、プレワン初心者さんとデータサイエンティストと一緒に探ってみましょう。
自店舗の売上予測にプレワンを活用するため、予測分析を勉強中。
プレワンの活用支援を担当。
「データ準備」の悩みを解決!
時系列予測(※)をする際に、データがエラーになってしまいます。
データの状態について確認してみましょう!時間情報項目が「等間隔」になっていますか?
※時系列予測:過去の数値から未来の数値を予測すること。詳しくはこちら
土日は営業していないため、1週間のうち2日分が抜けたデータになっています。
その場合は時間を等間隔にするために、データを整理してみましょう。
整理しましたが、まだエラーが出るようです。
次の2点を確認しましょう。
① 時間情報項目が昇順
② すべての日時に重複がないこと
②について、異なる店舗のデータを入れたい場合、日時が重複してしまいます。
その場合、系列を分離させる項目を追加しましょう。
ここでは、「販売地域」を追加することで、対応できますよ。
なるほど、
① 時間情報項目が一定間隔で並ぶ
② 時間情報項目が昇順
③ 系列内ではすべての日時に重複がない
以上の条件を満たすようをデータを整える必要があったのですね。
ちなみにデータ準備機能の「日時による集約」機能を使うと、データを一定間隔に整理できますよ。
■データ準備機能とは?
簡単な操作で、加工処理を組み合わせて必要なデータ加工が実行できます。
また、作成したデータ加工処理の保存や再実行ができます。
■データ準備機能一覧
- ・集約・結合
日時による集約 / データ結合 / 時系列予測データの変換 - ・項目を加工
数値や文字列を置換 / 数値をビンに分割 / 数値を閾値で二値化 / 数値を四捨五入 / 数値の欠損を補完 / 文字列の欠損を補完 / 文字列に「その他」を追加 / 文字列の一部を置換 / 類似した文字列を統一 - ・項目を追加
数値に指定した演算を適用 / 文字列から数値を抽出 / 文字列を分割 / 日時から項目を作成 / テキストから県市町村を抽出 / 項目の差を計算 /項目をコピー / 項目を結合 - ・項目を削除
項目を削除 / 相関の低い項目を削除 - ・行を削除
条件に合う行を削除 / 欠損が含まれる行を削除 / 重複した行を削除
データの加工だけでなく、行や項目の削除も可能です。
データ加工に不慣れなため、データ準備機能を使うと予測分析へのハードルが下がる気がします。
予測したいテーマがあっても、データ加工を実装する時間がない人にもおすすめです。
データ準備機能は法人プラン、またはスタンダートプランのオプションからご利用可能です。
データの前処理、加工、集約を簡単に行うために活用していきましょう。
プランについて、詳しくはこちら
スムーズな予測分析への道【データ準備編】でした。