HOMEブログ > スムーズな予測分析への道【データ準備編】

スムーズな予測分析への道【データ準備編】

#3分でわかる!プレワンの話

Prediction One通称「プレワン」。このブログシリーズでは、まだまだ知られていないプレワンの特長を投稿していきます。

第3回目は、予測分析において必要不可欠な
「データ準備」についてご紹介

3回目の本日は、予測分析において必要不可欠な「データ準備」についてです。データ準備の際にぶつかる壁と解決のヒントについて、プレワン初心者さんとデータサイエンティストと一緒に探ってみましょう。

プレワン初心者さん

自店舗の売上予測にプレワンを活用するため、予測分析を勉強中。

データサイエンティスト

プレワンの活用支援を担当。

「データ準備」の悩みを解決!

時系列予測(※)をする際に、データがエラーになってしまいます。

データの状態について確認してみましょう!時間情報項目が「等間隔」になっていますか?

※時系列予測:過去の数値から未来の数値を予測すること。詳しくはこちら

土日は営業していないため、1週間のうち2日分が抜けたデータになっています。

その場合は時間を等間隔にするために、データを整理してみましょう。

整理しましたが、まだエラーが出るようです。

次の2点を確認しましょう。
① 時間情報項目が昇順
② すべての日時に重複がないこと

②について、異なる店舗のデータを入れたい場合、日時が重複してしまいます。

その場合、系列を分離させる項目を追加しましょう。
ここでは、「販売地域」を追加することで、対応できますよ。

なるほど、
① 時間情報項目が一定間隔で並ぶ
② 時間情報項目が昇順
③ 系列内ではすべての日時に重複がない

以上の条件を満たすようをデータを整える必要があったのですね。

ちなみにデータ準備機能の「日時による集約」機能を使うと、データを一定間隔に整理できますよ。

データ準備機能とは?

簡単な操作で、加工処理を組み合わせて必要なデータ加工が実行できます。
また、作成したデータ加工処理の保存や再実行ができます。

■データ準備機能一覧

  • ・集約・結合
    日時による集約 / データ結合 / 時系列予測データの変換
  • ・項目を加工
    数値や文字列を置換 / 数値をビンに分割 / 数値を閾値で二値化 / 数値を四捨五入 / 数値の欠損を補完 / 文字列の欠損を補完 / 文字列に「その他」を追加 / 文字列の一部を置換 / 類似した文字列を統一
  • ・項目を追加
    数値に指定した演算を適用 / 文字列から数値を抽出 / 文字列を分割 / 日時から項目を作成 / テキストから県市町村を抽出 / 項目の差を計算 /項目をコピー / 項目を結合
  • ・項目を削除
    項目を削除 / 相関の低い項目を削除
  • ・行を削除
    条件に合う行を削除 / 欠損が含まれる行を削除 / 重複した行を削除

データの加工だけでなく、行や項目の削除も可能です。

データ加工に不慣れなため、データ準備機能を使うと予測分析へのハードルが下がる気がします。

予測したいテーマがあっても、データ加工を実装する時間がない人にもおすすめです。

データ準備機能は法人プラン、またはスタンダートプランのオプションからご利用可能です。
データの前処理、加工、集約を簡単に行うために活用していきましょう。
プランについて、詳しくはこちら

スムーズな予測分析への道【データ準備編】でした。

PAGE TOP

お問い合わせ・資料はこちらから

資料ダウンロード お問い合わせ 体験版