不動産

成約価格の予測

首都圏の一戸建て物件について、基本情報と周辺施設情報から「成約価格」を数値予測。複数テーブルをまたぐ数値予測モデルを、対話だけで構築します。

やること
成約価格を当てる数値予測
使うデータ
学習 物件400件+周辺施設896行 / 予測 物件100件+周辺施設217行
所要時間の目安
  • 読むだけ約10分
  • アプリ操作しながら約30分

こんな業務に使えます

  • 査定を営業担当の経験に依存していてバラつく
  • 周辺施設や立地を感覚で価格に反映している
  • 外れ値物件の扱いに時間がかかる

終わったときに手に入るもの

  • 物件ごとの予測成約価格一覧(CSV でダウンロード)
  • 築年数・立地条件が価格にどう効くかの根拠
  • 予測が外れやすい価格帯の現地調査優先ルール

はじめに

このチュートリアルでは、不動産仲介業者の立場で「一戸建て物件の成約価格を数値予測する」課題に取り組みます。経験則に頼りがちな価格設定を、エージェントと一緒に作る客観的な数値予測モデルで裏付けるシナリオです。

物件の基本情報(建物面積・土地面積・駅徒歩分・築年数・所在地など)に加えて、周辺施設情報(スーパー・学校・病院までの距離)というサブデータも活用します。1物件に複数行ある施設データは、エージェントが自動で集計・結合してくれるため、Excel でのデータ加工は不要です。

最終的に、担当者の感覚で決めた価格と予測価格を突き合わせて、乖離の大きい物件を振り返る、という業務シナリオを体験できます。

シナリオとデータ

背景:「成約価格は担当者の経験頼みで、価格設定にブレがある。客観的な価格予測ができれば、価格提案と顧客説明の精度が上がる」という課題に対し、過去の成約データを使って数値予測モデルを構築します。

東京23区・東京都下・神奈川・埼玉・千葉の一戸建て物件のデータをもとに、まずは基本情報だけで予測モデルを作り、そこに周辺施設の距離データを加えると精度がどう変わるかを確認します。スーパーの近さが価格にどの程度効いているか、といったインサイトも寄与度から読み取れます。

使用するデータ

A0_物件情報.txt
ビジネス課題と物件データの説明テキスト
A1_物件基本情報_学習用.csv
物件の基本情報(学習用 400行・1物件1行)
A2_周辺施設情報_学習用.csv
周辺施設までの距離(学習用 896行・1物件あたり平均2.24行)
B1_物件基本情報_予測用.csv
物件の基本情報(予測用 100行)
B2_周辺施設情報_予測用.csv
周辺施設までの距離(予測用 217行)
サンプルデータ(ZIP)をダウンロード 002_不動産_成約価格の予測.zip

1課題設定

A0(成約価格予測の業務説明)と、物件基本情報(A1)・周辺施設情報(A2)の学習用ファイルを投入します。エージェントは 1 物件 1 行のテーブルと 1 物件複数行のサブテーブルを自動で見分け、物件 ID 単位で成約価格を当てる数値予測タスクとして課題シートを組み立てます。ヒアリングでは、目的変数を成約価格に固定すること、周辺施設の距離データをどう集計して取り込むかといった論点が対話形式で確認されます。

1-1課題テキストとデータのアップロード

課題テキストとデータのアップロード
課題テキスト A0_物件情報.txt と学習用の物件基本情報・周辺施設情報を投入すると、エージェントが「物件ID で結合して成約価格を当てる数値予測タスク」として自動認識し、課題シートに初期値を書き込みます。

1-2エージェントとの対話による課題整理

エージェントとの対話による課題整理
「周辺施設データ(A2)は 1 物件に複数行あるが、どう集計するか」「外れ値物件をどう扱うか」などをエージェントが順に質問してきます。業務背景を長文で書く必要はなく、短い回答で意図を伝えられます。

1-3最終レビューと次ステップへの移行

最終レビューと次ステップへの移行
整理された課題定義(目的変数=成約価格、タスク=数値予測)を最終確認し、データ準備のステップへ進みます。

2データ準備

物件基本情報(A1)の1物件1行データに対して、周辺施設情報(A2)の複数行レコードから、スーパー・学校・病院などの最寄り施設までの距離や平均距離が自動で集計され、物件ごとの特徴量として横並びに展開されます。駅徒歩分や建物面積といった基本特徴量と、周辺施設までの距離という生活利便性を示す特徴量が、1つの学習テーブルに統合されます。加工内容も自然言語で説明されるため、集計ロジックの妥当性を業務担当者がレビューできます。

2-1エージェントによるデータ加工結果

エージェントによるデータ加工結果
周辺施設情報(A2)が施設種別ごとの「最寄り距離」や「件数」へと集計され、物件 1 行+基本情報+周辺施設サマリという学習テーブルに整形されました。

2-2加工方法の説明

加工方法の説明
「スーパーまでの最短距離」「半径内の駅数」といった加工ルールをエージェントが自然言語で説明。不動産査定ロジックとの整合を業務担当者がレビューできます。

3予測モデル作成

基本情報と周辺施設情報を結合した学習テーブルから数値予測モデルを学習させると、決定係数誤差率中央値の水準評価が画面に出て、エージェントが「価格提案の裏付けに使えるかどうか」を日本語でコメントしてくれます。寄与度を見ると、建物面積や築年数といった基本項目に加えて、周辺施設までの距離も上位に入り、「駅徒歩分だけでは測れない生活利便性」が価格形成に寄与していることが読み取れます。予測と実績の散布図では、どの価格帯で予測が当たりやすく、どこで外れやすいかの傾向も把握できます。

① どのくらい当たる?予測精度(概要)

予測精度(概要)
学習が完了すると、決定係数)と誤差率中央値MAPE)をはじめとする精度指標が「予測精度レベル」の★評価とともに要約されます。 0.80・MAPE 5% 程度なら、エージェントも「実務で活用しやすい精度」とコメントする水準です。

② 何が効いた?寄与度

寄与度ランキング
寄与度の項目別ランキングが並び、右側には各項目が成約価格を「押し上げる方向」「押し下げる方向」のどちらに効くかを色分けした構成も同時に表示されます。建物面積や築年数だけでなく、周辺施設までの距離(スーパー・学校・病院)も上位に入り、立地条件が価格へ与える影響と、その効き方の方向を 1 画面で把握できます。

③ どこで外した?予測と実績の対応

予測と実績の対応
予測価格と実勢価格の対応を散布図で可視化。大きく外した価格帯、逆によく当たる価格帯が一目で分かり、数値予測モデルの得意・不得意を具体的に検証できます。

④ 総合評価は?予測モデルのまとめ

モデルサマリー
決定係数誤差中央値・重要な特徴量・利用上の注意点をひとまとめにした「予測モデルのまとめ」。査定補助として使える水準か、どこに注意すべきかを 1 画面で俯瞰できます。

4予測と活用

予測用の物件基本情報(B1)と周辺施設情報(B2)をまとめて投入すると、物件ごとの成約価格予測が一覧で得られます。担当者の感覚で決めた価格と予測価格を突き合わせて、乖離の大きい物件を洗い出せば、価格設定の妥当性を客観的にレビューできますし、顧客への説明時にも「相場に対してこの物件がどう位置付くか」を根拠付きで示せます。エージェントからは、乖離が大きい物件に対する追加調査や価格見直しといった次アクションの提案も返ってきます。

4-1予測ファイルのアップロード

予測ファイルのアップロード
予測用の物件基本情報(B1)と周辺施設情報(B2)を投入します。学習時と同じ集計・結合処理が自動で再適用されるため、運用のたびにデータ加工コードを書く必要はありません。

4-2予測結果テーブル

予測結果テーブル
各物件に予測価格が付与された一覧が表示されます。CSV でダウンロードし、査定レポートや社内システムへ取り込めます。

4-3エージェントからの施策提案

エージェントからの施策提案
「想定価格を大きく上回る物件はヒアリングを追加」「予測が外れやすい価格帯の物件は現地調査を優先」など、次アクションの提案がエージェントから返ってきます。

まとめ

物件の基本情報と周辺施設情報という 2 つのテーブルを結合し、成約価格を当てる数値予測モデルをエージェントとの対話だけで構築できました。担当者の価格設定を裏付ける数値予測モデルに仕上がっています。

エージェントが出力する寄与度ランキングを見ると、周辺施設(A2)由来の距離特徴量が上位に入り、駅徒歩分だけでは測れない「生活利便性」が価格に効いている様子が可視化されます。このインサイトは、経験則では説明しきれなかった部分を言語化する助けになります。

  • 数値予測モデルも、二値分類と同じ 4 ステップで構築できる
  • 複数行に分かれたサブデータ(A2)は、エージェントが自動で集計・結合してくれる
  • 物件の基本特徴量に加え、周辺施設の距離が寄与度上位に入り、経験則の裏付けになる
  • 精度指標と寄与度の可視化により、価格提案の根拠を客観的に示せる

次に読むなら

他のテーマも、それぞれ単独で最後まで進められます。興味のあるものからどうぞ。