「1.1 予測分析が最適なソリューションなのか確認する」に取り組む

前回のあらすじ

  • 前回の話で、タツヤさんは「課題を設定する→データを用意する→予測モデルを作成する→精度を確かめる→予測をする/寄与度を活用する(業務への適用)」という予測分析の大まかな流れを把握しました
  • 予測分析の基礎知識」を参考に新たな知識を身に付けました

「1.1.1 データを可視化し素性を把握する」に取り組む

1 課題を設定する」には、

のステップがあるのか……。まずは「1.1 予測分析が最適なソリューションなのか確認する」を読んでみよう。
「予測分析は何かの値を予測しその値を使ってビジネスアクションを取りたい場合に行うデータ分析」で「データを可視化するだけで十分な場合や、週次で集計されるダッシュボードがあるだけで良い場合などは、予測分析ではなく可視化やダッシュボードの作成に注力しましょう」と……。
具体的に何をすれば良いのかわからないから詳細を見てみよう。


「1.1.1 データを可視化し素性を把握する」によると、まずは可視化でデータの特徴をつかむのが大事なのか。普段は異常値のチェックしかしてなくて、例えばエアコンごとにそのエアコンが製造されたときの各種センサーデータなどをまとめた可視化とかはしていなかったな……。まずはこれをやってみよう。


エアコンごとの製造時センサーデータを可視化してみた。正常なエアコンと故障したエアコンで違いはあるのかもしれないが、センサー値にはいろいろなものがあってどれが原因なのかはパッとわからない……。

「1.1.2 可視化だけでなく将来や未知の値を予測したいのか確認する(もしくは寄与度分析をしたいのか確認する)」に取り組む

「予測分析は何かの値を予測しその値を使ってビジネスアクションを取りたい場合に行うデータ分析」で「データを可視化するだけで十分な場合や、週次で集計されるダッシュボードがあるだけで良い場合などは、予測分析ではなく可視化やダッシュボードの作成に注力しましょう」と最初に書いてあった。
つまり、可視化で原因がわかるような場合はそれで十分ってことだな。さっき可視化はしてみたがすぐに原因が分かるような類のものではなかった。確かに正常と故障で違いはありそうだが、センサー値の種類が多くて自分で探していくのは困難なうえ、正常なエアコンの中でもデータ値にはある程度のばらつきがあるため、原因の特定が難しい……。
「1.1.2 可視化だけでなく将来や未知の値を予測したいのか確認する(もしくは寄与度分析をしたいのか確認する)」では、「将来の値ではなく要因分析をしたい、という場合もPrediction Oneの寄与度を活用できます」とあるが、今回はエアコンの故障率を下げるため何が故障の要因となっているのか特定できると嬉しい。つまり予測分析が価値を生むはずだ。


よし、そしたらデータの可視化もできたし、予測分析が価値を生みそうなことも確認した。つまり「1.1 予測分析が最適なソリューションなのか確認する」のタスクはこれで完了だ!
次は「1.2 予測分析で解きたい課題を設定する」だな。


まとめ

このページでタツヤさんは以下のタスクを完了しました。

  • 1.1.1 データを可視化し素性を把握する
  • 1.1.2 可視化だけでなく将来や未知の値を予測したいのか確認する(もしくは寄与度分析をしたいのか確認する)

ここではタツヤさんになったと思って進め方ガイドのチェックを埋めてみましょう。


「『1.2 予測分析で解きたい課題を設定する』に取り組む」にすすむ
PAGE TOP

お問い合わせ・資料はこちらから

資料ダウンロード お問い合わせ 体験版