その他の仕様

二値分類・多値分類用データセット作成時の注意点

Prediction One では、ファイルの先頭1000行を読み込んで予測したい項目の値が何種類あるのかを判定します(上記の例だと「継続」と「退会」の 2 種類) 。予測したい項目が文字列の場合、判定されたユニーク数によって二値分類か多値分類かの判定を行います。 二値分類を実行したい場合、先頭1000行に予測したい項目の値が 2 種類出現するようにしてください。多値分類を実行したい場合、先頭1000行に予測したい項目の値が3種類以上出現するように並び替えておいてください。また、200種類を超える分類には対応していませんのでご注意ください。

欠損値の扱い

欠損値とは、記録が取れていないデータを指します。 欠損値がある場合は、空文字を利用してください。

予測モデル作成(学習)用データのサイズ

100 行~ 100 万行、2 列~ 200 列の予測モデル作成(学習)用データを用意してください。時系列予測モードの場合は、20 行~ 1 万行、2 列~ 200 列の予測モデル作成(学習)用データを用意してください。データ結合を利用する場合は、予測モデル作成(学習)用データと関連データの合計の列数が 200 列以内になるように予測モデル作成(学習)用データを用意してください。

行数や列数が増えるほど、学習にかかる時間・メモリ使用量は増加します。メモリ使用量がお使いの PC の容量を超えるとソフトウエアが終了する場合があります。

このページの情報は役に立ちましたか?