<img height="1" width="1" style="display:none" src="https://www.facebook.com/tr?id=220807558931713&amp;ev=PageView&amp;noscript=1">

回帰分析とは?基礎知識や活用事例を紹介!

 2022.06.21  株式会社電算システム

回帰分析とは、データ分析でよく使われる、統計的手法のひとつです。複数のデータ同士の関係性や影響力を調べられるため、特にマーケティングなどでは、事業の最適化や効率化に役立てられています。この記事では、回帰分析の種類やメリット、活用の具体例などを挙げながら、回帰分析とはどのようなものなのか、また、Google Cloud を利用した回帰分析について解説します。

回帰分析とは

回帰分析とは、複数の値の関係性を調べる統計的な手法です。お互いに影響を与え合う値の関係性を調べる相関分析とは異なり、回帰分析では「影響を与える値」と「影響を与えられる値」の一方向の関係性を調べます。マーケティング分野などでは、主に結果に対する原因を推測する際に利用されます。

たとえば、複数の駅の近辺に店舗を構えるチェーン店の、各店舗の売上高を比較するとします。まずは、来店者数、広告宣伝費の額、最寄り駅からの距離、最寄り駅の乗降者数など、売上高(結果)に対して影響を与えていそうな項目(原因)を洗い出します。

その項目のデータをもとに回帰分析を行うと、それぞれの項目がどのように売上高へ影響力を持っているのかがわかります。結果に対する原因とその影響力の大きさがわかれば、売り上げの見通しやビジネス展開に役立てられるのです。

初めてのデータ活用

初めてのデータ活用

知識やツールといった手段を揃えただけでは価値を生み出すデータ活用の実現は困難です。データ活用のポイントは、データ「量」と「質」を確保することにあります。

  • データ「量」と「質」を確保しよう
  • データを収集して加工処理する作業を効率的に
  • データ分析に集中できる体制へ

資料ダウンロード

回帰分析の種類

回帰分析にはさまざまな種類があります。ここでは、もっとも単純な「単回帰分析」と、単回帰分析の応用である「重回帰分析」について解説します。

単回帰分析

回帰分析では、結果として表れている項目(売上高など)を「目的変数」と呼びます。また、目的変数に影響を与えている項目(来店者数など)を「説明変数」と呼びます。

単回帰分析では、目的変数yに対して1つの説明変数xがどのように影響を与えているのかを検討し、y=ax+b(aとbは定数)という式(回帰式)を導きます。後述する重回帰分析よりもシンプルで、その他にも複数ある回帰分析を理解するうえでも、もっとも基本的な考え方です。

重回帰分析

重回帰分析とは、1つの目的変数yに対し、複数の説明変数xn(n=1,2,3,……)を用いて、関係性を検討する手法です。y=ax1+bx2+cx3+……+dxn+eというような回帰式で表せます。

重回帰分析は、単回帰分析よりも複雑な式ではありますが、その分実用的になります。応用範囲が広く、売上予測やプロモーション戦略といったマーケティング現場でよく活用されています。

回帰分析のメリット・デメリット

回帰分析を行うメリットは、統計的に根拠のある推論が得られることです。現在の態勢を続けるとどれほどの利益を見込めるのかなど、データが得られていない時点の予測も行えます。また、どの項目をどれほど増減させれば最大利益を得られるか、というシミュレーションも可能です。

一方で、回帰分析にはデメリットもあります。洗い出した原因(説明変数)の他にも、目的変数に影響を与えている項目がある可能性があります。すべての可能性を考慮しなければ、より正確な予測やシミュレーションはできません。

逆に、重回帰分析で説明変数どうしが影響を及ぼし合っていると、目的変数の予測を正しく行えません。むやみに説明変数を増やすのではなく、組み合わせなどの精査も必要です。

また、特に重回帰分析は概念や計算処理が複雑です。処理はExcelなどのツールを用いるとしても、分析内容について理解を深めていないと、適切な解釈や予測ができない可能性があります。

データ分析

回帰分析を活用した予測事例

【例1】「最寄り駅乗降者数は、売上高にどれくらいの影響を与えているか」が知りたいという事例を仮定して、単回帰分析の活用例を紹介します。

駅の近辺に店舗を構えるチェーン店各店舗の売上高と、それぞれの最寄り駅の乗降者数を調査したところ、下図の左表のようになったとします。売上高を目的変数y、乗降者数を説明変数xとして、Excel2013のデータ分析(回帰分析)ツールを用いて分析した結果が、右表(水色)です。

回帰分析を活用した予測事例

結果の中にある「係数」欄の2つの数字をy=ax+bの式に当てはめると、y=0.27x+55.57(小数点第三位以下切り捨て)という回帰式を得られます。この式を使うと、たとえば、新しく出店しようとするエリアの駅の乗降者数をxに代入して、新規店舗の売上高の予測ができます。

ただし、使用した説明変数が目的変数にあまり影響を与えていなかった場合、回帰式の精度は低くなり、予測に活用できないことがあります。回帰式の信頼性は、「重決定R2」で判断できます。重決定R2は「決定係数」とも呼ばれ、この数値が1に近いほど精度の高いモデルとなります。今回はその値が0.68なので、この回帰式を用いた予測結果の信頼性は、決して低くないが高いともいえない水準です。

【例2】「スーパーの利用者数と品目数は、売上高に、どれくらい影響を与えているか?」が知りたいという事例を仮定して、重回帰分析の例を紹介します。

あるスーパーの店舗ごとの売上高と、利用者数・品目数をまとめたところ、下図の左表のようになったとします。このデータを、Excel2013のデータ分析(回帰分析)ツールを用いて分析すると、右表(水色)のような結果となりました。

回帰分析を活用した予測事例

重決定R2の値が0.89のため、この回帰式を用いると信頼性の高い予測ができるでしょう。

たとえば、店舗eの売上高を200万円まで上げたいとき、回帰式においてy=200、x1=119を代入すると、x2=244が得られます。つまり、品目数を244まで増やせば、売上高が200万円を超える可能性が高いということがわかります。

Google Cloudが回帰分析をサポート

回帰分析を行う際は、Google Cloud (旧GCP:Google Cloud Platform)の利用がおすすめです。Google Cloud とは、Googleがクラウド上で提供するサービスの総称です。高性能な仮想マシンや機械学習を活用したビッグデータ分析、低コストでのアプリケーション開発など、さまざまなサービスが提供されています。これらのサービスを最大限に活用することで、信頼性の高いデータ分析基盤を構築できるでしょう。

Google Cloud Vertex AI

Google Cloud のサービス群の一つに、機械学習プラットフォームの「Google Cloud Vertex AI」が存在します。機械学習プラットフォーム、という名の通り、データの収集や前処理、機械学習モデルの作成やトレーニング・評価、実際にデータに機械学習を掛けての予測など、機械学習全体のフローをすべてカバーしており、一箇所で効率的に実施することができます。

Vertex AI の強み

Vertex AI の強みとして挙げられるのは、以下のような特徴・機能です。

  • 運用難易度の低さ
  • 学習効率を高めるための機能
  • ワークフローの管理機能

Vertex AI は、Googleが公式に「コード不要の最低限の専門知識でモデルをトレーニング」できるサービスであることを謳っています。他社の競合サービスであるクラウドAIプラットフォームに比べても運用難易度が低いとされており、比較すると機械学習モデルのトレーニングに必要なコードの行数をおよそ80%も少なくできるとしています。統計学に長けたデータサイエンティストで無くとも、運用がしやすいようなサービスになっているのです。

次に、Vertex AI は効率的なAI開発を実施する上での機能も満載です。前述通り、Vertex AI はデータ分析、機械学習に関わるGoogle Cloudのサービスを統合したプラットフォームであるため、データサイエンティストやエンジニアが機械学習オペレーションを実装し、開発ライフサイクル全体を通じて、効率的にMLプロジェクトを構築、管理できる仕組みとなっています。

また、VertexAIは機械学習モデルのハイパーパラメータ(※)を自動的にチューニングできるサービス、Visier も統合しています。これにより、エンジニアがモデルのチューニングに必要としていた時間を大幅に削減し、多くのトレーニングにリソースを割けるようになります。

最後に、Vertex AI Pipelines という機能が存在し、ワークフローの管理をサポートしてくれます。機械学習モデルに利用するためのデータの確保や分析、機械学習モデルの作成やトレーニング、そしてトレーニング結果の評価に至るまでを実行する役割を果たし、スムーズなサービス実装を実現可能です。

以上のように、Vertex AI はGoogle Cloud に存在する機械学習に必要なMLツールをすべて、1つのAIプラットフォームに統合したサービスです。本稿で紹介した回帰分析やその他の分析手法も、Vertex AI 上で実装をすることで、様々な恩恵を得つつ、スムーズに結果を導き出すことができるのです。

(※)機械学習アルゴリズムの挙動を設定するパラメータをさします。この数値を調整することで、機械学習を通して得られた結果(予想の数値等)の精度を高めることができます。

まとめ

データ分析を行う基盤を整えると、事業の最適化・効率化が実現し、企業の成長に繋がります。しかし、膨大なデータを適切に連携させ、データ分析の目的や内容に応じた使用しやすい基盤を構築することは簡単ではありません。株式会社電算システム(DSK)では、開発エンジニアが Google Cloud を活用し、データ分析基盤や個別のシステム開発を支援しています。データ収集から可視化、新たな課題の発見まで、データ分析のサポートを一貫して行うことが可能です。根拠のある確実性が高いマーケティング戦略を立てたい場合は、ぜひデータ分析の導入を検討してみてください。

初めてのデータ活用

RELATED POST関連記事


RECENT POST「データ分析」の最新記事


データ分析

データ分析の種類と方法

データ分析

データ分析基盤に求められること

データ分析

マーケティングで使えるデータ分析の手法8選!

データ分析

データ分析に必要なスキルとは。求められる活用術を紹介

回帰分析とは?基礎知識や活用事例を紹介!