寄与度が高いはずの項目の寄与度が低い場合に参考にするページです。
寄与度の確認の仕方については「4.2 寄与度を確認する」をご覧ください。
寄与度が高いはずの項目の寄与度が低い原因として以下が考えられます。これらに問題がないか確認を行い「2 データを用意する」をやり直しましょう。
データに間違いがあると予測モデルが正しくその項目と予測対象との関係性をつかむことができなくなってしまい、寄与度が高いはずでも低いと判断してしまいます。
データに間違いがないか確認しましょう。
Prediction Oneのデータタイプには「日時」「数値」「文字列」「テキスト」のデータタイプがあります。基本的にはPrediction Oneが自動で適切なデータタイプを判別するため、気にせずに予測モデルを作成すれば大丈夫ですが、その項目に含まれる情報を適切に扱うためにご自身でデータタイプの選択を行う場合は、「予測分析の基礎知識 ▶ データとは」をご覧ください。
その項目のデータタイプが「文字列」の場合はユニーク数にも気を配る必要があります。
「文字列」の項目は「予測分析の基礎知識 ▶ データとは」のように質的データ(カテゴリデータ、カテゴリカルデータ)として扱われ、内部でOne-Hotエンコーディング(ダミー変数化)を行っています。ユニーク数が多いとこの時に内部で作成される説明変数(ダミー変数)が多くなってしまう一方で、それぞれのダミー変数ではほとんどの行が0でほんの一部の行のみが1となります。そうなると一つ一つのダミー変数から「そのダミー変数が1だから予測対象の値がこうなりそうだ」というパターンを見いだせなくなってしまい、結果としてその項目の寄与が低いと判断されてしまいます。
このような状況になった場合は予測モデルの精度も悪くなっている可能性が高いです。
この時はある程度似通ったカテゴリを一つにまとめてユニーク数を少なくするとよいです。「4.2 寄与度を確認する」の例だと『ランク(継続月数)』を『ランク』のみにまとめる対応を取っています。
「進め方ガイド」を利用している場合は今回作ったモデルを「作成したモデル」タブに登録しておきましょう。今後作り直す予測モデルとの比較を簡単に行えるようになります。