欠損とは、たとえばアンケートの中で未回答の項目があった場合のように、実際の値が不明である状態を指しています。
欠損値は、欠損状態を表すために用いられる値を指します。
Prediction One では欠損したデータに対しては「欠損している」という情報を与えて予測モデルを作成します。
そのため、たとえばある商品の売り上げデータについて、売り上げが「0円
」と記録された場合と売り上げが分からずに「」(不明なので空白にした)場合とでは異なるデータとして扱います。
一般に、予測したい項目に関係のある項目の欠損が少ないほど、より良い予測モデルを作成できます。
Prediction One では予測したい項目の一部が欠損していた場合、欠損したデータを取り除いて予測モデルを学習・評価します。 予測したい項目に欠損値が多く含まれていると、予測モデルが作成できない場合がある点に注意してください。