第34回 データマイニング

  • Clip to Evernote
  • Check

巷では「Siri」(注1)に代表されるAI(人工知能)への関心が高まっていますね。
AIはデータマイニングの機械学習から推論、問題解決を人に代わってコンピュータに行わせる技術です。
少し前になりますが、データマイニングの勉強会に参加したこともあり、今回はデータマイニングについて纏めてみました。

データマイニングとは
簡単にいうと「大量のデータの中から有益な情報を発掘」することです。
有益な情報とは、事実から関連性を発見し、仮説を導き出すこと。
データマイニングの有名な事例に「ビールと紙おむつ」があります。

米国のスーパーマーケットチェーンで販売データを分析した結果、ビールと紙おむつが一緒に 買われている傾向があることがわかった(事実)。子供のいる家庭ではかさばる紙おむつを 父親に買うよう頼み、父親は店に来たついでに缶ビールを購入していた(関連性)。そこで 2つ並べて陳列したところ売上が上昇した(予測)。

というものです。
データマイニングを行うには大量のデータ(何十万、何百万!)が必要となり、しかも収集するデータに 「欠損が少ない」、「異常値が少ない」、「重複のない」ものが適しています。
因みにAIは機械学習ですので、仮説、検証は行いません。

データマイニングでできること

●予測
予測はある条件のもと、ある商品が購入されるかを「購入した」、「購入しなかった」の確率を
算出して、どのような条件で、どのような商品が売れるかを予測し、顧客にアプローチすれば
購買率を上げることが可能になります。
●分類
商品をカテゴリーや価格帯などの条件で分け、その分類の共通点や相違点を見つけ出します。
例えば、顧客を男女別や年代別に分け、購入金額や購入した商品を分類することで、嗜好や
行動パターンなどを知ることができます。
●関連性
売れている商品の組み合わせや、気候、気温と連動して売れている商品などの相関関係が
見つかれば、それをマーケティング活動に活かせます。
またネット通販などでは過去の利用履歴から不正利用者を検出するなどにも利用されています。

データマイニングを利用するメリット

●販売への活用
「ビールと紙おむつ」の事例のように、一見関係のなさそうに事実から関係性を探り、セット
商品を販売したり、売り場を変更するなどして売上を伸ばす
●品質管理の向上
故障の傾向から故障率を軽減させる、故障しそうな箇所の改良・改善を行い、故障を未然に
防ぐことで品質を向上させる
●顧客満足度の向上
顧客に対しどのような購買活動を行うとリピーターになりやすいかを分析し、商品のレコメン
デーションを行ったり、インセンティブをつけて満足度を向上させる

データマイニングの活用
データマイニングで取り扱うデータは数値的なモノが中心ですが、最近では文章をフレーズやワードに 分解して、そのフレーズや単語の出現率や時系列で変化を分析(テキストマイニング)できるようになり、 実際に履歴書のテキストマイニングを行い、入社後の優秀社員がどうのようなフレーズやワードを 記入していたかを分析し、採用に活用している企業があります。

ビジネスを成功させるか否かの判断にデータマイニングを利用すれば、立てた仮説の検証が行えます。
否であれば仮説を補正する、別の仮説を立てるなどで成功の確率を上げることが可能になります。
システムを導入していれば、データ(事実)が保管されています。そこには、もしかすると宝の山が 隠れているかもしれませんね。
自社に眠るデータをデータマイニングしてみてはいかがでしょうか?

注1)SRIインターナショナルアップルが開発した機能。話しかけたことに答えてくれる。
例えば道順や曲名を教えてくれたり、ちかくのお店を調べてくれる...など