HOMEブログ > スムーズな予測分析への道【データ分析直前の心構え篇】

スムーズな予測分析への道【データ分析直前の心構え篇】

#3分でわかる!プレワンの話

Prediction One通称「プレワン」。このブログシリーズでは、まだまだ知られていないプレワンの特長を投稿していきます。

予測分析を行うときに大切なマインドセットを整理
第6回目は「データ分析直前の心構え」についてご紹介

6回目となる今回のテーマは、予測分析を行うときに大切なマインドセットについてです。
データを準備したはいいものの、どのように予測分析を始めればよいか疑問を抱えている方にぜひ読んでいただきたい記事となっています。プレワン初心者さん・データサイエンティストと一緒に、スムーズな予測分析の秘訣を探っていきましょう。

プレワン初心者さん

自店舗の売上予測にプレワンを活用するため、予測分析を勉強中。

データサイエンティスト

プレワンの活用支援を担当。

前回の復習とデータ分析の始め方

前回の記事では、データ準備の方法を確認しました。

データの準備方法はわかりましたが、実際どのように予測分析を始めればよいかについては、まだまだ不安が残ります。予測に使用するデータの量や予測する上で気をつける点を知りたいです。

AIツールを新しく導入した企業さんから、よく質問をいただく内容のひとつですね。
データ分析の際に必要なマインドセット(心構え)は、以下の2点です。
①データを完璧に揃えようとせず、まずは予測をしてみる
②予測分析でできることを正しく把握する~内挿・外挿とは~

①データを完璧に揃えようとせず、まずは予測をしてみる

例えば、売上予測の場合、「全ての商品データが揃っていないため、予測分析を始められない」と感じる方も多いですが、まずは手元にある自社データに優先度をつけて整えることが大切です。

なるほど、すべてのデータを完全に整えるのは難しく感じていたため勉強になります。優先度についてはどのように考えたら良いのでしょうか。

優先度をつけて予測分析をスモールスタートさせることで、効率的かつ効果的に結果を得られます。具体的な考え方として、「パレートの法則」「ABC分析」をご紹介します。

■パレートの法則

「全体の数値の8割は、構成要素のうち2割にあたる要素が生み出している」という法則。
80:20の法則とも呼ばれており、売上や成果が一部の構成要素に集中する(少数の要因が大勢を左右する)ことを示す経験則。予測分析においても、まずは「売れ筋の商品」「単価やリピート率の高いお客様」など、上位20%のデータから手を付け始めることが大切です。

■ABC分析

在庫/品質/得意先管理などを行う際に使われる、パレートの法則に基づいた分析フレームワーク。
売上高、コスト、在庫などの評価軸について、全体に対する累積構成比が大きいカテゴリの順番に可視化して、重要度や優先度を判断する手法。重要度の高い要素に経営資源を多く配分することで、実態に即した経営戦略を立て、効率的な売上・利益の向上が期待できます。

なるほど!自社内における優先順位を可視化したうえで、まずは大部分を占める部分から分析し始めるのがポイントなんですね。

②予測分析でできることを正しく把握する~内挿・外挿とは~

AIによる予測分析の得意領域である「内挿」と、不得意領域である「外挿」を理解することも非常に大切です。

「内挿/外挿」…初めて聞きました。どのような意味なのでしょうか?

機械学習の訓練時に入力・学習させたデータの範囲内でアウトプットを求めることが「内挿」。
逆に、訓練したことがない領域に関するアウトプットを求めることが「外挿」です。

外挿について、通勤時間の予測を例にイメージしてみましょう。

■例)通勤時間の予測

毎朝同じ時間に家を出発し、平均30分かけて電車で通勤するAさんの通勤時間を予測する場合、外部要因によって数値は変動します。
晴れた日は25分で会社に着く一方、雨の日は遅延で45分かかるといった具合です。

ただし、予測が難しい日も存在します。例えば、事故による運転見合わせが生じると、2時間近く電車が止まる可能性もありますが、振替輸送を使えば50分で会社に到着できるかもしれません。過去に該当する事実やデータが存在しないような、突発的なイベントや事故が発生した場合、これらを考慮して正確な予測を行うことは非常に困難になります。

晴れの日、雨の日:比較的正確な予測が可能
運転見合わせ:予測が困難

このように、通勤時間の予測を行う際には、通常の範囲内(内挿)の要因であれば予測の精度は信ぴょう性がある一方で、これまで起きたことがない外部要因が絡む(外挿)と予測結果の信ぴょう性は注意が必要になります。

データ分析初心者は、一度高い予測精度が出るとその後も信頼できる結果が得られると考えがちですが、それはあくまで内挿領域のデータを扱う前提の話です。外挿領域のデータを与える場合、十分に信頼できる結果とは限らないので、注意しましょう。

なるほど。確かに、一度思い通りの精度が得られたら、「他のどのデータを用いても同様の精度が得られる!」と考えてしまうかもしれません。

そうなんです。一般的に、機械学習にとって「内挿」は得意で「外挿」は不得意な領域とされています。ここを正しく理解せず予測分析を行うと、期待した結果・精度が継続的に得られない、AIツールを導入したメリットがないという事態につながります。

まとめ

今回は、データ分析を始める際に大切なマインドセットについて整理しました。

・優先度の高いデータから整え、スモールスタートで予測分析を始める
・訓練データ領域の範囲内(内挿)か範囲外(外挿)かを注意して分析を行う

この2点が大切でした。

その通りです。正しい知識を頭に入れて、「始め方がわからない」「期待した結果が得られない」といった事態を防ぎましょう!

法人プランでは、専門家のサポートを受けることが可能です。不安点の解消や精度向上をご支援します。
プランについて、詳しくはこちら
スムーズな予測分析への道【データ分析直前の心構え篇】でした。

PAGE TOP

お問い合わせ・資料はこちらから

資料ダウンロード お問い合わせ 体験版