情報管理

故障情報の自動分類

修理受付時に担当者が手作業で記録している「故障タイプ」を、指摘症状の文章と機器の稼働ログから6クラスに自動分類。テキスト列と複数行ログを組み合わせた多値分類モデルを、対話だけで構築します。

やること
6 種類の故障タイプに振り分ける多値分類(6クラス)
使うデータ
学習 修理300件+稼働ログ900行 / 予測 修理100件+稼働ログ300行
所要時間の目安
  • 読むだけ約10分
  • アプリ操作しながら約30分

こんな業務に使えます

  • 修理受付で熟練者が故障タイプを毎回判断している
  • 初動で型番だけで振り分けていて差し戻しが多い
  • 症状テキストの読み解きに時間がかかる

終わったときに手に入るもの

  • 修理IDごとの予測故障タイプ+第2候補(CSV でダウンロード)
  • 症状文言と稼働ログのどちらが判断に効くかの根拠
  • 確率が低いケースを熟練者レビューに回す運用ルール

はじめに

このチュートリアルでは、モニター製品の修理受付業務を想定し、「担当者が手作業で分類している故障タイプを、エージェントと一緒に自動判定する」多値分類モデルを Prediction One (エージェント版) で構築します。

指摘症状の自由記述(テキスト)に加えて、機器の稼働ログ(月次の稼働時間と稼働区分)というサブデータを組み合わせて学習します。テキスト列と複数行の時系列ログをまとめて扱うケースとして、エージェント版の強みが分かりやすく体感できる題材です。

最終的には、テキストだけで学習する場合と稼働ログを追加する場合の精度を比較し、「どんなデータを足すと予測が改善するか」をデータから読み解くインサイトも得られます。

シナリオとデータ

背景:「モニター製品の修理受付では、担当者が指摘症状を読んで故障タイプを分類しているが、件数の増加と担当者ごとの判断のばらつきが課題になっている」というシナリオです。故障タイプは「ソフトウェア / 電源・接続 / ディスプレイ / 傷・割れ / ボタン / その他」の6種類で、これを自動判定する分類モデルを構築します。

特徴的なのは、予測対象に効くシグナルが「指摘症状の自由記述(テキスト)」と「機器の稼働ログ(数値 × カテゴリ)」の両方に散らばっている点です。テキストだけでもある程度分類できますが、症状が曖昧なケースでは誤分類が発生します。そこで稼働ログを加えることで、「ソフトウェア故障の機器は修理前に高負荷稼働が多い」といったパターンを捉えられるかを確認します。

使用するデータ

A0_故障情報分類業務.txt
業務背景と6クラス分類の課題説明テキスト
A1_故障修理記録_学習用.csv
修理記録(学習用 300行・指摘症状テキスト+型番・指摘箇所・保証状況)
A2_稼働ログ_学習用.csv
機器の月次稼働ログ(学習用 900行・1機器あたり3ヶ月分)
B1_故障修理記録_予測用.csv
修理記録(予測用 100行)
B2_稼働ログ_予測用.csv
機器の月次稼働ログ(予測用 300行)
サンプルデータ(ZIP)をダウンロード 003_情報管理_故障情報の自動分類.zip

1課題設定

A0(6クラス故障分類の業務説明)と、修理記録(A1)・稼働ログ(A2)の学習用ファイルを投入します。エージェントは自由記述の指摘症状と1機器複数行の月次稼働ログを自動認識し、修理ID単位で故障タイプを当てる多値分類タスクとして課題シートを組み立てます。ヒアリングでは、テキスト列を学習対象に含めるかの確認や、稼働ログを何ヶ月分さかのぼって使うかといった論点が対話で整理されていきます。

1-1課題テキストとデータのアップロード

課題テキストとデータのアップロード
課題テキスト A0_故障情報分類業務.txt と学習用の修理記録・稼働ログを投入すると、エージェントが「修理ID で結合して故障タイプを多値分類する」タスクとして自動認識し、課題シートに初期値を書き込みます。

1-2エージェントとの対話による課題整理

エージェントとの対話による課題整理
「故障タイプは 6 種類、学習データ内でクラスごとの件数に偏りはないか」「稼働ログはどの粒度でまとめるか」などをエージェントが順に質問してきます。対話の中で件数の偏りへの配慮まで擦り合わせられます。

1-3最終レビューと次ステップへの移行

最終レビューと次ステップへの移行
整理された課題定義(目的変数=故障タイプ、タスク=多値分類)を最終確認し、データ準備のステップへ進みます。

2データ準備

修理記録(A1)の1修理1行データに対して、稼働ログ(A2)の月次レコードから該当機器の直近数ヶ月分の稼働時間や稼働区分の統計量が自動で展開され、修理1件ごとの特徴量として横並びに整えられます。指摘症状のテキスト列はそのまま保持されるため、テキストと構造化数値が混在した学習テーブルが1ステップで用意できます。加工ロジックも自然言語で説明されるので、担当者が集計粒度や参照期間の妥当性をレビューできます。

2-1エージェントによるデータ加工結果

エージェントによるデータ加工結果
稼働ログ(A2)が稼働区分別にまとめ直され、修理 1 件+症状テキスト+稼働サマリという学習テーブルに整形されました。

2-2加工方法の説明

加工方法の説明
指摘症状テキストの扱い、稼働時間を区分別にまとめる理由をエージェントが自然言語で説明します。業務担当者が「このログの見方で正しい」とレビューできます。

3予測モデル作成

テキスト列と稼働ログの統計量を組み合わせた多値分類モデルを学習させると、正解率・平均 F値の水準評価が画面に出て、エージェントが「受付の一次振り分けとして実用できるかどうか」を日本語でコメントしてくれます。寄与度を見ると、指摘症状のテキスト由来の項目が大きなシグナルとして上位に並びつつ、稼働ログ由来の指標も食い込み、「テキストだけでは曖昧な症状を稼働状況が補完している」構造が読み取れます。混同行列では、どのクラスで取り違えが起きやすいかを 1 枚で把握できます。

① どのくらい当たる?予測精度(概要)

予測精度(概要)
学習が完了すると、正解率・平均 F値・平均 Precision / Recall が「予測精度レベル」の★評価とともに要約されます。正解率 77% 程度なら、エージェントも「一次振り分けとして実用可能」とコメントする水準です。

② 何が効いた?寄与度

寄与度ランキング
寄与度の項目別ランキングが並び、右側には各項目がどのクラスを「押し上げる方向」「押し下げる方向」に効くかを色分けした構成も同時に表示されます。指摘症状テキスト由来の項目と稼働ログ由来の項目のどちらが効いているか、そしてどの故障タイプに対してどう効いているかを 1 画面で把握できます。

③ どこで外した?予測と実績の対応

予測と実績の対応
6 クラス × 6 クラスの混同行列で、どの故障タイプを取り違えやすいかが一目で分かります。紛らわしいペアを知っておくと、学習データの追補対象を絞りやすくなります。

④ 総合評価は?予測モデルのまとめ

モデルサマリー
正解率・重要な特徴量・クラス別の精度・利用上の注意点をひとまとめにした「予測モデルのまとめ」。現場運用に耐えうるか、どこに弱点があるかを 1 画面で俯瞰できます。

4予測と活用

新規受付の修理記録(B1)と、対応する機器の稼働ログ(B2)をまとめて投入すると、修理案件ごとに 6 クラスの故障タイプ予測と各クラスの予測確率が得られます。予測確率の高い案件はそのままルーティングに、低い案件は人が確認する、といった切り分けが可能です。エージェントからは、予測結果を修理受付システムへ API 連携する案や、誤分類が集中しているクラスへの学習データ補強といった次アクションの提案も返ってきます。

4-1予測ファイルのアップロード

予測ファイルのアップロード
予測用の修理記録(B1)と稼働ログ(B2)を投入します。学習時と同じ集計・結合処理が自動で再適用されるため、運用のたびにデータ加工コードを書く必要はありません。

4-2予測結果テーブル

予測結果テーブル
各修理ID に予測故障タイプ・予測確率・第 2 候補クラスが付いた一覧が表示されます。CSV でダウンロードし、修理受付の初動判断に使えます。

4-3エージェントからの施策提案

エージェントからの施策提案
「予測確率が低いケースは熟練者レビュー必須」「特定クラスに偏るなら学習データを補強」など、運用ルールの提案がエージェントから返ってきます。

まとめ

自由記述のテキスト列と、1機器あたり複数行ある稼働ログを組み合わせた多値分類モデルを、エージェントとの対話だけで構築できました。担当者の分類作業を補助する実用的なモデルに仕上がっています。

エージェントが出力する寄与度ランキングを見ると、指摘症状のテキストが大きなシグナルでありつつも、稼働時間の統計量など A2 由来の特徴量も上位に食い込みます。「単にテキストを読むだけでは見抜けない機器の使われ方」が分類に効いていることが分かり、テキストデータと構造化データを一緒に扱う業務では、このような「データを足す価値」が寄与度として可視化できます。

  • テキスト列を含む多値分類も、4ステップの標準フローで構築できる
  • 1機器あたり複数行ある月次ログは、エージェントが統計量に自動展開して学習に使う
  • テキストだけでは曖昧な症状を、稼働ログが補完して分類精度を押し上げる
  • 予測結果を修理受付システムに連携することで、担当者の確認作業を効率化できる

次に読むなら

他のテーマも、それぞれ単独で最後まで進められます。興味のあるものからどうぞ。