前処理で表形式データを用意出来なかった場合

行が各レコード、列がそれを説明する情報という1つの表の形でデータを用意できなかった場合に参考にするページです。
データの用意方法については「2 データを用意する」をご覧ください。

予測分析は表形式データに対する予測技術のため、行が各レコード、列がそれを説明する情報というフォーマットの表形式データが必須です。このフォーマットに従わないデータ(音声・画像・動画などの非構造化データ。詳しくは「予測分析の基礎知識データとは」をご覧ください。)は適切に前処理をする必要があります。
例えば、音声データであれば数ミリ秒ごとの波形(周波数)データに変換することで表形式で表せるようにしたり、画像データであれば画像中の重要なピクセルの平均RGB値を利用したりすることが考えられます。
一方でこのような非構造化データの取り扱いに特化した機械学習技術(≠予測分析)も存在します。非構造化データを扱いたい場合は予測分析が最適なソリューションなのか検討が必要です。
また、社内で情報が分散し個々のデータは表形式なのに1つの表にまとまっていないという場合もあるかもしれません。Prediction Oneには「データ準備機能」があり複数ファイルから1つの表形式データを作成することもできます。
これらを踏まえ追加の情報を1つの表形式で用意出来そうな場合は「2 データを用意する」をもう一度実施しましょう。
もし設定した課題で、行が各レコード、列がそれを説明する情報というフォーマットの表形式データを用意出来そうにない場合は、課題を設定しなおす必要があります。「1 課題を設定する」を参考にもう一度課題を設定しましょう。

このページの情報は役に立ちましたか?
PAGE TOP

お問い合わせ・資料はこちらから

資料ダウンロード お問い合わせ 体験版