情報管理：故障情報の自動分類 | Prediction One (エージェント版) マニュアル

■ はじめに

このチュートリアルでは、モニター製品の修理受付業務を想定し、「担当者が手作業で分類している故障タイプを、エージェントと一緒に自動判定する」多値分類モデルを Prediction One (エージェント版) で構築します。

指摘症状の自由記述（テキスト）に加えて、機器の稼働ログ（月次の稼働時間と稼働区分）というサブデータを組み合わせて学習します。テキスト列と複数行の時系列ログをまとめて扱うケースとして、エージェント版の強みが分かりやすく体感できる題材です。

最終的には、テキストだけで学習する場合と稼働ログを追加する場合の精度を比較し、「どんなデータを足すと予測が改善するか」をデータから読み解くインサイトも得られます。

■ シナリオとデータ

背景：「モニター製品の修理受付では、担当者が指摘症状を読んで故障タイプを分類しているが、件数の増加と担当者ごとの判断のばらつきが課題になっている」というシナリオです。故障タイプは「ソフトウェア / 電源・接続 / ディスプレイ / 傷・割れ / ボタン / その他」の6種類で、これを自動判定する分類モデルを構築します。

特徴的なのは、予測対象に効くシグナルが「指摘症状の自由記述（テキスト）」と「機器の稼働ログ（数値 × カテゴリ）」の両方に散らばっている点です。テキストだけでもある程度分類できますが、症状が曖昧なケースでは誤分類が発生します。そこで稼働ログを加えることで、「ソフトウェア故障の機器は修理前に高負荷稼働が多い」といったパターンを捉えられるかを確認します。

使用するデータ

A0_故障情報分類業務.txt: 業務背景と6クラス分類の課題説明テキスト
A1_故障修理記録_学習用.csv: 修理記録（学習用 300行・指摘症状テキスト＋型番・指摘箇所・保証状況）
A2_稼働ログ_学習用.csv: 機器の月次稼働ログ（学習用 900行・1機器あたり3ヶ月分）
B1_故障修理記録_予測用.csv: 修理記録（予測用 100行）
B2_稼働ログ_予測用.csv: 機器の月次稼働ログ（予測用 300行）

サンプルデータ（ZIP）をダウンロード 003_情報管理_故障情報の自動分類.zip

1課題設定

A0（6クラス故障分類の業務説明）と、修理記録（A1）・稼働ログ（A2）の学習用ファイルを投入します。エージェントは自由記述の指摘症状と1機器複数行の月次稼働ログを自動認識し、修理ID単位で故障タイプを当てる多値分類タスクとして課題シートを組み立てます。ヒアリングでは、テキスト列を学習対象に含めるかの確認や、稼働ログを何ヶ月分さかのぼって使うかといった論点が対話で整理されていきます。

1-1課題テキストとデータのアップロード

1-2エージェントとの対話による課題整理

1-3最終レビューと次ステップへの移行

2データ準備

修理記録（A1）の1修理1行データに対して、稼働ログ（A2）の月次レコードから該当機器の直近数ヶ月分の稼働時間や稼働区分の統計量が自動で展開され、修理1件ごとの特徴量として横並びに整えられます。指摘症状のテキスト列はそのまま保持されるため、テキストと構造化数値が混在した学習テーブルが1ステップで用意できます。加工ロジックも自然言語で説明されるので、担当者が集計粒度や参照期間の妥当性をレビューできます。

2-1エージェントによるデータ加工結果

2-2加工方法の説明

3予測モデル作成

テキスト列と稼働ログの統計量を組み合わせた多値分類モデルを学習させると、正解率・平均 F値の水準評価が画面に出て、エージェントが「受付の一次振り分けとして実用できるかどうか」を日本語でコメントしてくれます。寄与度を見ると、指摘症状のテキスト由来の項目が大きなシグナルとして上位に並びつつ、稼働ログ由来の指標も食い込み、「テキストだけでは曖昧な症状を稼働状況が補完している」構造が読み取れます。混同行列では、どのクラスで取り違えが起きやすいかを 1 枚で把握できます。

Step 3 は 時間順ではなく、4 つの観点でモデルを確認します。

1 どのくらい当たる？予測精度（概要） 2 何が効いた？寄与度 3 どこで外した？予測と実績の対応 4 総合評価は？予測モデルのまとめ

① どのくらい当たる？予測精度（概要）

② 何が効いた？寄与度

寄与度ランキング — 寄与度の項目別ランキングが並び、右側には各項目がどのクラスを「押し上げる方向」「押し下げる方向」に効くかを色分けした構成も同時に表示されます。指摘症状テキスト由来の項目と稼働ログ由来の項目のどちらが効いているか、そしてどの故障タイプに対してどう効いているかを 1 画面で把握できます。

③ どこで外した？予測と実績の対応

④ 総合評価は？予測モデルのまとめ

モデルサマリー — 正解率・重要な特徴量・クラス別の精度・利用上の注意点をひとまとめにした「予測モデルのまとめ」。現場運用に耐えうるか、どこに弱点があるかを 1 画面で俯瞰できます。

4予測と活用

新規受付の修理記録（B1）と、対応する機器の稼働ログ（B2）をまとめて投入すると、修理案件ごとに 6 クラスの故障タイプ予測と各クラスの予測確率が得られます。予測確率の高い案件はそのままルーティングに、低い案件は人が確認する、といった切り分けが可能です。エージェントからは、予測結果を修理受付システムへ API 連携する案や、誤分類が集中しているクラスへの学習データ補強といった次アクションの提案も返ってきます。

4-1予測ファイルのアップロード

4-2予測結果テーブル

4-3エージェントからの施策提案

■ まとめ

自由記述のテキスト列と、1機器あたり複数行ある稼働ログを組み合わせた多値分類モデルを、エージェントとの対話だけで構築できました。担当者の分類作業を補助する実用的なモデルに仕上がっています。

エージェントが出力する寄与度ランキングを見ると、指摘症状のテキストが大きなシグナルでありつつも、稼働時間の統計量など A2 由来の特徴量も上位に食い込みます。「単にテキストを読むだけでは見抜けない機器の使われ方」が分類に効いていることが分かり、テキストデータと構造化データを一緒に扱う業務では、このような「データを足す価値」が寄与度として可視化できます。

テキスト列を含む多値分類も、4ステップの標準フローで構築できる
1機器あたり複数行ある月次ログは、エージェントが統計量に自動展開して学習に使う
テキストだけでは曖昧な症状を、稼働ログが補完して分類精度を押し上げる
予測結果を修理受付システムに連携することで、担当者の確認作業を効率化できる

■ 次に読むなら

他のテーマも、それぞれ単独で最後まで進められます。興味のあるものからどうぞ。

マーケティング

顧客行動予測に基づいたターゲティング

会員属性と閲覧履歴から購入見込みを予測し、販促メールのターゲットを絞り込む

不動産

成約価格の予測

物件基本情報と周辺施設情報を結合し、成約価格を当てる数値予測モデルを構築する

生産管理

出荷数予測による生産計画の精度向上

7年分の出荷実績と問い合わせ件数を組み合わせて、製品別月次出荷数を先読みする時系列予測モデルを構築する

チュートリアル一覧へマニュアルトップへ

故障情報の自動分類

こんな業務に使えます

終わったときに手に入るもの