<img height="1" width="1" style="display:none" src="https://www.facebook.com/tr?id=220807558931713&amp;ev=PageView&amp;noscript=1">

データウェアハウスとデータベースとの違いは?導入のポイントを解説

 2020.10.05  ラクまるブログ編集部

企業が膨大なデータを分析して意思決定をしていくためには、データウェアハウスの活用が有効です。この記事では、データウェアハウスの概要やデータベースの違い、データウェアハウスの特徴などについて基礎から解説していきます。

そもそもデータウェアハウスとは?

データウェアハウス(DWH)とは、複数のシステムより収集した膨大なデータを時系列で整理し保管したデータベースのことです。

データウェアハウスは英語で「Data WareHouse」と記述し、日本語に訳すと「データの倉庫」になります。つまりデータウェアハウスとは、大量で多種多様なデータをまとめて保存しておく場所(サーバー)やその管理システムのことです。

日々膨大なデータにさらされている企業が、迅速かつ適切な意思決定を行うためには、データを迅速かつ適切に分析して活用することが不可欠です。データウェアアハウスに格納されたデータは目的に応じて整理された、いわゆる「きれいな」データであり、迅速な分析に役立ちます。

データウェアハウスの必要性

データウェアハウスはその有用性から、近年のビジネスにおいて注目を浴びています。

データウェアハウスは、企業が意思決定を行うことを目的として整理されたデータの集合体です。企業が扱うデータは多岐にわたり、それぞれが独立して存在しています。しかし、企業の意思決定では複数のデータを総合的・横断的に分析する必要があり、データウェアハウスがなければデータ分析に時間がかかってしまいます。これらのことからデータウェアハウスはデータ分析において必要不可欠だと言えます。

初めてのLooker
Lookerで実現する全社データ・ドリブン化

データウェアハウスとデータベースの違いとは?

データウェアハウスとデータベースにはどのような違いがあるのでしょうか。両者の違いを整理するうえでは、「データ容量の大きさ」「データ分析のしやすさ」の2点に着目するとわかりやすいでしょう。

ここからは、データウェアハウスとデータベースの違いについて解説します。

データ容量の大きさ

データウェアハウスとデータベースの違いの一つとして、蓄積できる「データ容量の大きさの違い」が挙げられます。

データが増えすぎてしまうとデータベースの容量を超えてしまうため、サマリデータの形で蓄積しておかざるを得ません。しかし、この状態では長期的な売上推移や顧客動向の分析が困難になります。一方、データウェアハウスではデータの分析目的に応じて整理することが可能になっています。

データ分析のしやすさ

データウェアハウスとデータベースは、「データ分析のしやすさ」も異なります。

データがシステムごとに異なる形式で保存されている場合は、あるシステムから別のシステムへ転送する必要があり、時間と手間がかかります。データを統合できたとしても、データの集計や分析にも非常に多くの時間がかかるのです。

しかし、データウェアハウスであれば、保存する際に時系列でデータを整理するため、スムーズ分析を始めることができます。

データウェアハウスの定義

データウェアハウスについて解説してきましたが、データウェアハウスの定義とはそもそもどのようなものなのでしょうか。

ここからは、データウェアハウスの定義について、以下の4点に分けて解説します。

  • サブジェクトごとに保管
  • データの統合
  • データを消去しない
  • 時系列を持つ

それぞれについて、見ていきましょう。

サブジェクトごとに保管

データウェアハウスの特徴としてまず挙げられるのが、サブジェクトごとの分類・保管です。

データウェアハウスはデータマートのようにデータを目的別に整理するのではなく、データをサブジェクト、つまり主題別に分解・整理して保存します。

例えば、販売データには商品名称や商品コード、販売日や定価などさまざまな情報がありますが、データウェアハウスではこれを「商品」「取引」などと主題別に整理して保存します。

そうすることで、別の目的で集計されたデータを保有している場合に、データの重複保有を防ぐことができるのです。

データウェアハウスは、図書館のようにデータ(本)がユーザーの利用目的別ではなく主題・内容別に並んでいる様子をイメージするとわかりやすいです。

データの統合

データウェアハウスの目的は、企業が扱うさまざまなデータを複数のシステムから統合することです。

しかし、企業のあらゆるデータを単に集めるだけでは、1つのデータベースに同じようなデータが重複して存在してしまう可能性があり、あまり意味がありません。

そのため、データを物理的に1つのシステムに集めるだけでなく、データの内容ごとに論理的に統合することが、データウェアハウスでは必要なのです。

データウェアハウスを構築する際は、主題・内容ごとにデータを整理して蓄積していきます。

例えば、同じ顧客データでも部署ごとに「顧客データ」「お客様データ」といったようにラベルが異なる可能性があるため、IDを付与するなどして同じ主題のデータを統合するのです。

データを消去しない

データウェアハウスを構築する際、データを消去することはありません。

データベースの場合は不要となったデータは保有せずに消去するのが一般的です。

一方、データウェアハウスは膨大なデータを主題別に保管することで、データ分析に活用することを目的としています。そのため、今は不要なデータでも今後必要になる可能性があるため、基本的に消去することはないのです。

ただし、これはあくまでも原則であり、容量や使用頻度を鑑みてデータを消去することはあります。データを消去するは、「消去した」という履歴をしっかり残すことが重要です。データを消去する際は「古いデータを消去する」というデータを追加し、消去した記録が残るようにします。

時系列を持つ

データウェアハウスに蓄積しているデータには、時系列があります。

古い情報は消去され新しい情報に更新されるデータベースとは異なり、データウェアハウスは新しいデータを追加する際も、古いデータを消去することなく蓄積していくため、結果としてデータに時系列が生まれるのです。そのため、現在の情報だけでなく現在に至るまでの履歴も確認でき、過去の状況把握も含めて、データ分析に活用することができます。

時系列を持つことは、データウェアハウスにおける非常に重要な要素と言えるでしょう。

「永遠にデータを消去せず、古いデータに新しいデータを蓄積していく」というわけではありませんが、3~5年程度はデータを保有し、蓄積していくのが一般的です。

まとめ

データウェアハウスとはさまざまなシステムからデータを収集し、主題別・時系列に整理して保存する、データの保管方法です。データウェアハウスはデータを主題別に整理して統合し、消去せず時系列で蓄積していくという特徴から、分析のしやすさやデータ容量の節約といったメリットがあります。

過去との比較や分析を行えるデータウェアハウスの特徴を把握し、導入を検討してみてはいかがでしょうか。

初めてのLooker

RELATED POST関連記事


RECENT POST「Looker」の最新記事


データウェアハウスとデータベースとの違いは?導入のポイントを解説
よくわかるGSuite無料セミナー