二値分類用のデータセットを例に予測寄与度の詳細画面を説明します。
顧客データからプレミアムサービスの購入を予測するためのデータセットです。
このサンプルデータセットは、「データ」→「サンプル」タブのデータ一覧から取得可能です。


画面左側には各項目の予測寄与度の大きさが一覧表示されます。寄与度が大きいほどバーの長さが長くなります。バーの長さはもっとも寄与度が高い項目に対する相対的な長さになります。
青いバーは購入確率(「購入あり」の予測確率)を上げる方への寄与度の大きさを表します。赤いバーは購入確率を下げる方への寄与度の大きさを表します。
「並び順」のプルダウンでどのバーを表示するかを切り替えられます。項目名やバーをクリックすると左側の表示が、クリックした項目のものに切り替わります。

画面右側には左側で選択した項目に関する詳細が表示されます。画面中で「顧客ランク」項目がクリックされているとします。「顧客ランク」は、「プラチナ」「ゴールド」「シルバー」「ブロンズ」のいずれかになります。この画面から、「プラチナ」である顧客は「購入あり」の予測確率を高めるように予測に寄与することがわかります。
寄与度の強さは「寄与度」のバーの長さで表示されます。「項目に占める割合」はデータセットの中で選択した項目が項目内容の値である顧客の割合です。
このデータセットだと、「顧客ランク」が「プラチナ」である顧客が、全顧客の 32%いることになります。「プラチナ」は寄与度も大きく顧客も多い重要な情報であることがわかります。

「顧客ランク」が「ブロンズ」「シルバー」「ゴールド」である顧客は「購入なし」の予測確率を高める(「購入あり」の予測確率を下げる)ように予測結果に寄与することがわかります。寄与が大きい順に表示され、寄与の大きさは「寄与度」のバーの長さで表示されます。
仮にこのサービスに詳しい実務者がいた場合、これらの結果は当たり前に見えるかもしれません。実務者の感覚や直感と一致していることが確認できれば、予測に対する信頼を強めることができます。

次に「過去購入額」項目がクリックされているとします。「過去購入額」 は数値の項目です。数値の項目は値の範囲が自動的に設定され、範囲ごとに購入確率にどう寄与するかが表示されます。
「数値の範囲」を見ると、「過去購入額」のどの範囲が予測確率を上げるのか下げるのかが一目でわかるようになっています。青が「購入あり」へ寄与、赤が「購入なし」へ寄与します。