データ分析の種類と方法

 2019.09.30  ラクまるブログ編集部

ビジネスにデータ分析を取り入れることで、物事を数値データに基づいて判断できるようになります。そのため意思決定をスピードアップを図ることのみならず、今まで見落としていた事象や傾向の把握など、売上拡大に繋がる施策の検討が可能になります。また、不良品発生の傾向や顧客クレームの内容などを把握することで、製品やサービスの品質改善や業務の効率化を図るといった、コスト削減などに役立てることもできます。

一方で、強いてデメリットを挙げれば、データ分析を効果的に行うため、適切なスキルや効率的な作業環境などが必要になります。


本稿では、より効果的なデータ分析を実施する上で、データ分析に種類と方法について解説致します。

データ分析は何のためにある?

これからデータ分析を始めるという方には、まずデータ分析が「何のために必要なのか?」について考えていただきたいと思います。

昨今では「データドリブン経営(データ駆動型の経営)」など、データ分析の重要性を物語るようなキーワードが頻出しています。また、日常生活においてもスマートフォンの利用が高まったことにより、結果として日々デジタルデータに触れる機会が増えたことで、「これからのビジネスにはデータ分析や活用が不可欠だ!」という風潮が強まっているのも事実です。

しかしながら、データ分析を意識的に行っていない企業の中にも十分に成果をあげていて安定した経営をしている会社や、データ分析が行われていなくても、戦略的な考えにもとづいて経営している企業も多数あります。

まずは「データ分析はやらなければいけないもの」という固定概念を捨て、自社あるいは自部門においてデータ分析を行う意義について改めて見直してみることが大切です。

当社では、データ分析の重要性について「解決すべき問題・取り組むべき課題がある中で、意思決定に必要な情報を提供し、正しい意思決定を素早く下すための手段」と捉えています。その上で、必要となる手段やツールを検討するべきと考えています。

目的に沿ったデータ分析を選ぶ

正しいデータ分析を行うために重要なポイントは「目的に沿ったデータ分析手法を選ぶ」ということです。一口にデータ分析といってもその種類は多種多様で、分析方法が違えばそこから導き出される情報も異なってきます。従って、目的に沿った分析手法やツールを選択することがより適切なデータ分析を行うための第一歩になります。

では、目的別にどのようなデータ分析手法があるのか代表例をご紹介していきます。

全体像を把握するためのデータ分析

1.1.度数分布とヒストグラム

⇒一定の傾向を特定する

1.2.平均と標準偏差

⇒どのような状況になっているかを特定する

1.3.正規分布

⇒統計データからどのような予測が立つかを特定する

1.4.標本調査

⇒一部のデータ(標本)全体像を推測する

1.5.標本平均

⇒一部のデータ(標本)の平均から全体の平均を推測する

比較して判断するためのデータ分析

2.1.相関関係

⇒複数のデータの関係性から隠れた特徴を抽出する

仮説を検証するためのデータ分析

3.1.散布図と回帰分析

⇒相関関係のある一部のデータから全体像を推測する

3.2.重回帰分析

⇒2つ以上の複合した相関関係の一部のデータから全体像を推測する

3.3.質的データの取り扱い

⇒そのままでは計算できない質を表したデータを分析する

知識を発見するためのデータ分析

4.1.テキストマイニング

⇒テキスト情報から一定の知見や発想を得る

4.2.外れ値の取り扱い

⇒突出したデータに着目して想定外を特定する

このように、データ分析手法は大きく4つのカテゴリに分類され、その下に複数のデータ分析手法が存在します。データ分析の目的からカテゴリを決め、さらに細かいデータ分析首相を決定していくのがポイントです。

[RELATED_POSTS]

データ分析の方法

それではデータ分析の具体的な方法について解説します。ここでは特に使用されることの多いデータ分析についてご紹介します。

①度数分析とヒストグラム

度数分析とは、データを一定のルールで整理し、データがどのような値を中心にしてどのようなバラつき方をしているのかを把握することで、全体データの特徴や性質などを理解する手法です。

一方ヒストグラフとは、バラつきの分布状態(度数分布)を棒グラフで表したものであり、「箱ひげ図」とも呼ばれます。

たとえばPOSデータを使って度数分析とヒストグラムを行うとすると、時間あたりの平均客単価を算出し、それをグラフで表すことによってどの時間帯での客単価がピークになるのかを視覚的に確認することができます。

②標本調査と標本平均

標本調査とは大量のデータから無作為に一部のデータを抽出して観測した場合に、その背後にある大量のデータを推測する手段として、仮説検定の考え方にもとづいた統計的推定手法です。

一方、標本平均とは、標本調査から得られた情報から、母集団の傾向を推測するためのデータ分析手法になります。母集団の平均を推測するために、標本となるデータの平均値を利用します。

たとえば市内に在住している人すべてにアンケート調査を実施することは難しいため、数百人単位で無作為に抽出した人を対象にアンケート調査を行います。その調査結果から、市内住民全員の傾向を調査します。さらに標本平均を利用することで、市内住民全員の平均値を推測することができます。

③相関関係

相関関係とは一方の値が変化すれば他方の値も変化するという、2つの値の関連性を表します。「正の相関」ならば2つのデータのうち一方が増加するともう一方も増加します。「負の相関」ならば2つのデータのうち一方が増加するともう一方が減少します。

この相関関係は複数のデータの関係性から隠れた特徴を抽出するためにあります。たとえば顧客にサービス満足度調査を実施した際に、調査結果の中から満足度と相関関係が強い項目等を把握することで、満足度を向上するために必要な実施事項を想定することができます。

④回帰分析と重回帰分析

回帰分析とは「原因となる数値」と「結果となる数値」の関連性を、統計的手法を持ち調査するためのデータ分性手法です。原因となる数値(説明変数)の変化により、結果となる数値(目的変数)が変化することが推測できます。これによって仮説を立て、事象発生の関連性について把握できます。

一方重回帰分析とは、1つの目的変数を複数の説明変数で予測しようとする統計的手法のことです。

たとえばプールの来場者について調査する際に、回帰分析では「気温が上がることでプールの来場者数が増えるのでは?」という仮説のもと、気温と来場者数の関連性を調査します。さらに重回帰分析では、「気温と降水確率によって来場者数が増減するのでは?」という2つ以上の複合した関連関係のあるデータから、全体像を把握することができます。

常に正しいデータ分析を心がけよう!

いかがでしょうか?データ分析の手法はたくさんあり、それぞれに特徴や導き出せる情報が違います。あり程度経験に基づいて理解していた傾向なども、データ分析手法を用いて分析することで、客観的な考察がしやすく、また、その結果をチームで共有することにも役立ちます。

導き出したい結果により、使用すると良い手法も異なります。固定概念にとらわれず、様々な分析を試してみることも大切です。

電算システムでは、お客様のデータ分析を支援するための各種データ分析サービスをご用意しています。データ収集から実際に分析するための環境構築、データサイエンティストによるデータ分析のご支援まで幅広いサービスラインナップで、お客様のデータ分析業務をご支援します。

ぜひお気軽にご相談ください。

データ・ドリブン時代の歩き方

RELATED POST関連記事


RECENT POST「Google Cloud Platform」の最新記事


データ分析の種類と方法
よくわかるGSuite無料セミナー