マーケティング：顧客行動予測に基づいたターゲティング | Prediction One (エージェント版) マニュアル

■ はじめに

このチュートリアルでは、会員サービスを運営している事業者を想定し、「プレミアムサービスの購入見込みが高い会員は誰か」を予測するモデルを Prediction One (エージェント版) で構築します。

会員の基本属性（顧客ランク・過去購入額・クーポン利用回数など）に加えて、サイトの閲覧履歴も学習データとして投入することで、属性情報だけでは見えない「購入意欲の気配」まで捉えます。複数のCSVファイルの結合・集計も、エージェントが自動で行うため、データ加工のコードを書く必要はありません。

最終的に、購入見込みが高い顧客を絞り込んで販促メールを送ることで、マーケティングコストを下げつつコンバージョンを上げる、という業務シナリオを体験できます。

■ シナリオとデータ

背景：「全会員に販促メールを一斉送信しているが、反応が薄くコスト効率が悪い。誰に連絡するかを絞りたい」という課題を持つマーケティング担当者が、過去の会員データをもとに購入見込みスコアを算出することになりました。

基本属性だけでも一定の予測は可能ですが、サイト内でどんなページをよく見ているかという 行動データ を加えることで、属性だけでは見えない「実際の関心度」を捉えることができます。このチュートリアルでは、その「行動データの追加で精度がどれだけ上がるか」を、エージェント版の標準フローの中で確認していきます。

使用するデータ

A0_プレミアム予測.txt: ビジネス課題の説明テキスト
A1_顧客属性_学習用.csv: 会員の基本属性（学習用 300行）
A2_閲覧履歴_学習用.csv: サイトの閲覧履歴（学習用 1,030行・1顧客あたり2〜5レコード）
B1_顧客属性_予測用.csv: 会員の基本属性（予測用 200行）
B2_閲覧履歴_予測用.csv: サイトの閲覧履歴（予測用 722行）

サンプルデータ（ZIP）をダウンロード 001_マーケティング_顧客行動予測に基づいたターゲティング.zip

1課題設定

A0（プレミアムサービス購入の予測課題）と、顧客属性（A1）・閲覧履歴（A2）の学習用ファイルをまとめて投入します。エージェントはファイル構成を自動で読み取り、会員ID単位でプレミアム購入の有無を当てる二値分類タスクとして画面右側の課題シートに初期値を流し込みます。続くヒアリングでは、目的変数をプレミアム購入有無に固定すること、1顧客あたり複数レコードある閲覧履歴をどう扱うかといった論点を、対話形式で順に確認していきます。

1-1課題テキストとデータのアップロード

1-2エージェントとの対話による課題整理

1-3最終レビューと次ステップへの移行

2データ準備

顧客属性（A1）の1顧客1行データに対して、閲覧履歴（A2）の複数行レコードをエージェントが自動で集計します。よく閲覧しているカテゴリの比率や閲覧回数などが顧客ごとの特徴量として展開され、属性単独では捉えづらい「サイト内でどんな関心を示しているか」がモデルに渡る形に整います。生成された学習用テーブルは、各処理がどのCSVのどの列に基づくかまでエージェントが自然言語で説明してくれるため、業務担当者でも加工内容をレビューできます。

2-1エージェントによるデータ加工結果

2-2加工方法の説明

3予測モデル作成

整えた学習用データから二値分類モデルを学習させると、分類精度（AUC）の水準評価が画面に出て、エージェントが「当たりやすいモデルかどうか」を日本語でコメントしてくれます。寄与度を見ると、顧客属性だけに頼っていた時には見えなかった閲覧履歴由来の項目が上位に入り、「関心の強さ」が実際のサイト内行動に現れている様子が読み取れます。予測精度・寄与度・混同行列・予測モデルのまとめ、とビューを切り替えながら、モデルの得意・不得意を多角的に検証できます。

Step 3 は 時間順ではなく、4 つの観点でモデルを確認します。

1 どのくらい当たる？予測精度（概要） 2 何が効いた？寄与度 3 どこで外した？予測と実績の対応 4 総合評価は？予測モデルのまとめ

① どのくらい当たる？予測精度（概要）

② 何が効いた？寄与度

寄与度ランキング — 寄与度の項目別ランキングが並び、右側には各項目が「購入あり」「購入なし」のどちらに引っ張るかを色分けした構成も同時に表示されます。顧客属性に加えて閲覧履歴由来の特徴量（プレミアム閲覧回数など）も上位に入り、「関心の強さ」が予測判断に効いている様子と、その効き方の方向を 1 画面で把握できます。

③ どこで外した？予測と実績の対応

④ 総合評価は？予測モデルのまとめ

モデルサマリー — AUC・正解率・重要な特徴量・利用上の注意点をひとまとめにした「予測モデルのまとめ」。施策に使える水準か、どこに弱点があるかをこの 1 画面で俯瞰できます。

4予測と活用

学習済みのモデルに、予測用の顧客属性（B1）と閲覧履歴（B2）をそのまま投入すると、会員ごとに「購入ありの確率」が付いた予測結果が得られます。この確率に閾値を設ければ、販促メールの送付対象を上位層に絞り込めます。エージェントからは「どの層を優先すべきか」「どんなクリエイティブが刺さりそうか」といった次アクションの提案も返ってくるので、運用開始直後から使える形になっています。