データ解析に使われる代表的な手法

 2019.12.23  ラクまるブログ編集部

「データ解析」と聞くと難しく考えがちですが、中にはExcelで解析できるものもあり、やり方さえ知れば誰でも行えます。もちろん、高度なデータ解析になると専門的な知識と技術が必要になりますが、最近ではBI(Business Intelligence)などデータ解析を自動化するツールも登場しているので、ある程度の知識と技術で解析できるものもあります。

本稿では、データ解析に使われる代表的な手法について、それぞれの概要を解説します。これからのデータ活用の参考にしていただければ幸いです。

データ解析に使われる代表的な手法

1. ABC

主に商品の売上金額や、顧客の商品購入金額など需要度によってランク分けする手法です。たとえば、次のような手順で解析します。

  • 商品ごとの売上を集計
  • 売上の多い順に並べ替える
  • 全体の売上に対する各商品割合を算出する
  • 割合上位の商品から累積
  • 累積値をもとに商品をABCでランク分けする

以上の手順が完了したら、商品を「売れ筋」や「死に筋」で分類していき、在庫管理や販売促進活動に生かしていきます。

2. アソシエーション

一見して関連性がない複数の事象が共起している場合、そこには何かしらの相関関係が隠れている可能性があります。たとえば「Webサイトで会員登録をするユーザーは、サービス登録前にWikipediaを見ている可能性が高い」といった関連性です。

アソシエーションでは複数の事象の関連性を見つけ出して、仮説を立てて、経営戦略やマーケティングに活かすことが可能です。一般的には、レコメンドエンジンなどのシステムに使われており、ほぼ同時に発生する違った行動に着目してみましょう。

3. クラスター

さまざまな性質のものがまじりあっている中で、類似しているポイントでグループに分類し、その属性を解析するという手法です。たとえば、パン屋で「バタール」「食パン」「カレーパン」にクラスターを用いると、次のように分類できます。

  • 価格が200円以上のパン:バタール、食パン
  • 売上全体に対し5%以上の売上:食パン、カレーパン
  • 惣菜パンに分類される:カレーパン

このようにさまざまな軸でグループ分けを行い、複数のクラスターを作ることで各商品がどのように売上に貢献しているかを確認できます。ユーザーのセグメンテーションやブランドポジションの確認にも活用できます。

4. クロス集計

基本的なデータ解析の1つであり、Excelに標準搭載されている機能なので誰でも行えるのが特徴です。アンケート調査などを通じて集まったデータを年齢・性別・地域・職業などのさまざまな属性別に集計します。なので、クロス集計では2~3種類程度の、複数の属性についての相関関係を分析し、属性ごとに大まかなトレンドを把握するのに向いています。

主に、アンケート集計、仕入れ計画、販売予測、世論調査などによく使われています。

G Suiteで実現するこれからの時代のコミュニーケション

5. グレイモデル

過去のデータをもとに、それに続く数値をグレイ法で予測していきます。明白になっているデータを白色、不明なものを黒色、あいまいな状態を灰色と定義していき、白色データと黒色データをもとに灰色データ(今後)を予測するデータ分析手法です。

6. バスケット

アソシエーションから派生したデータ解析手法です。概要は変わりませんが、分析対象がユーザーの購入商品に限定されます。要するに、「バスケットに何を入れているか?」を把握することで、Aの商品とBの商品が同時に購入されている確率が高い、などのデータが算出できます。

ECサイトを利用した際のレコメンド機能に活用されたり、POSシステムに登録されたデータをもとに同時購入率の高い商品を割り出します。

7. ロジスティック回帰

ある質問に対して「YES」と「No」でデータを集計し、事象の発生確率を予測するための手法です。結果は確率なので、0~1の間で表されるのが特徴です。たとえば、「商品Aと一緒に購入されている商品は何か?」といった多変量データを求めるのではなく「商品Aを買ったか否か?」という2択で考えます。

主に病気の発生確率予測や、ターゲット顧客の商品購入率の予測などに使われています。治療やマーケティング効率がより高くなるための取り組みに最適です。

8. 計量時系列

株価やECサイト売上など、時系列で表せられるデータには何かしらの構造があると仮定します。軽量時系列ではそれら変数間の動学的関係を明らかにし、ビジネスにおける仮説や理論を検証できるデータ解析手法です。

かみ砕いて説明すると、時系列で変動するデータの流れを解析して、マーケティング等を展開するためのものです。

9. 決定木

1つの原因をもとにして、「もしも~だったら、こういった結果になるだろう」という仮説を何度か繰り返し、その結果から幾通りかの予測を行う手法です。仮説を繰り返すことで経過が樹木上に枝分かれしていき、木のようなモデル図が作られるため、決定木分析という名称が付いています。主に、リスクマネジメント分野で用いられ、回帰木、分類木とも呼ばれています。

10. 主成分

たくさんの項目(変数)があるデータに対し、ごく少数の項目に置き換えることでデータ全体の見通しをよくする手法です。ちなみにこのプロセスを次元の縮約と呼びます。データ変数が少ない場合は、あまり必要のないデータ分析手法ですが、変数が100や200ともなると大いに活用できます。変数を縮約することで、一部の情報を捨てているという難点があるのでご注意ください。

11. 線形回帰

複数のデータをクロス集計することで得られるグラフは主に曲線で表されます。線形回帰では、こういったグラフに論理的に考え出された直線を引くというデータ解析手法です。各データの相関関係を知るのに役立ちます。

データ解析を実施するには?

データ解析にはさまざまな手法があり、中には高度なものもあります。しかし、大切なのはデータ解析に関する専門的な知識や技術を身に着けることではありません。あなたがデータサイエンティストとして活躍したいのであれば話は別ですが、データ解析をビジネスで活用することが目的であれば、まずは正確で信憑性の高いデータを集めることがポイントになります。

データ解析に失敗する要因はさまざまですが、中には集計したデータの正確性が低く、使えるデータではないというケースが多いでしょう。そうすると、せっかく解析したデータもビジネスの役には立たないため、データ解析の意義が失われます。

まずは、簡単にデータが集約できる環境を整えておくことは、データ解析の第一歩と言えます。

まとめ

いかがでしょうか。大切なポイントは「データ解析はあくまで手段」ということです。データ解析を実施してそこから様々な情報を得られたとしても、それをビジネスに活かせなければ意味はありません。大切なのは、如何に解析したデータをいかにしてビジネスへ活かすかです。データ解析を実施する際は、これらのポイントに注意しながらビジネスに効果を発揮する解析を目指していきましょう。

電算システムでは、データの分析や解析を支援するための各種「データ分析サービス」をご用意しています。データ収集から実際に分析するための環境構築やデータサイエンティストによる整えたデータの分析作業やサポートなど幅広いサービスラインナップでお客様のデータ活用をご支援します。ぜひお気軽にご相談ください。

初めてのデータ分析

データ・ドリブン時代の歩き方
Lookerで実現する全社データ・ドリブン化

RELATED POST関連記事


RECENT POST「データ分析」の最新記事


データ解析に使われる代表的な手法
よくわかるGSuite無料セミナー