「顧客の声のラベリング自動化」の例で
絞り込みを「全て表示」にした場合で説明します。
この時、csv出力される各項目は以下の通りです。
- ランク(全て表示)
- 項目
- 全体の予測値増加の寄与度
- 分類
- 予測値増加_n番目_項目内容
- 予測値増加_n番目_下限
- 予測値増加_n番目_上限
- 予測値増加_n番目_寄与度_バーの長さ
- 予測値増加_n番目_寄与度_スコア
- 予測値増加_n番目_データに出現する割合
- 予測値増加_n番目_項目内容の数
なお、n は 1~3 です。
ランク(全て表示)
「ランク(全て表示)」は、寄与度の詳細画面に出てくる各項目の順番の数字です。
項目
「項目」は、寄与度の詳細画面に出てくる各項目です。
全体の予測値増加の寄与度
「全体の予測値増加の寄与度」は、各項目のバーをマウスオーバーしたときに表示される数値です。今回は5つに分類する問題なので5つ同じ値が並んでいます。
下は投稿内容のバーをマウスオーバーした際の例です。
分類
「分類」は、多値分類で予測したい項目に含まれている値 (つまり分類先) です。今回は5つに分類する問題なので5つの値が並んでいます。
予測値増加_n番目_項目内容
「予測値増加_n番目_項目内容」は、それぞれの項目をクリックし右側の詳細を表示させたときの項目内容です。
顧客年齢のように数値の項目の場合、その範囲の下限と上限が「_ (アンダーバー)」区切りで出力されます。
予測値増加_n番目_下限 (と上限)
「予測値増加_n番目_下限 (と上限)」は、項目内容が数値である場合の下限と上限です。
数値でない場合は、0 が入ります。
予測値増加_n番目_寄与度_バーの長さ
「予測値増加_n番目_寄与度_バーの長さ」は、7段階表示で示される各項目内容のバーの長さです。
予測値増加_n番目_寄与度_スコア
「予測値増加_n番目_寄与度_スコア」は、7段階表示で示される各項目内容のバーをマウスオーバーしたときに表示される実際の値です。
予測値増加_n番目_データに出現する割合
「予測値増加_n番目_データに出現する割合」は、それぞれの項目内容が学習データ中に占める割合です。
予測値増加_n番目_項目内容の数
「予測値増加_n番目_項目内容の数」は、学習データ中のそれぞれの項目内容の数です。
画面上にこれが表示されている部分はありませんが、データに出現する割合が同じような意味の表示内容です。
絞り込みが「全て表示」の場合で説明しましたが、「(a)外見」「(b)製品にキズ」「(c)バッテリー」「(d)説明書」「(e)音質」(予測したい項目に含まれる値の種類) でもcsv出力のされ方は同様です。