<img height="1" width="1" style="display:none" src="https://www.facebook.com/tr?id=445779107733115&amp;ev=PageView&amp;noscript=1">

データウェアハウス(DWH)を徹底解説!
構築方法やおすすめのツールも紹介

 2023.09.04  2023.11.17

近年、データをもとに意思決定を下すデータドリブン経営に注目する企業が増えています。データウェアハウスは、データドリブン経営に必要なシステムの1つです。データ基盤を構築するため、注目を集めるデータウェアハウスですが、聞き慣れない用語が多く、構築を踏みとどまっている企業も多いでしょう。

そこで本記事では、データウェアハウスの概要、活用シーン、特徴、ほかの情報システムとの違い、構築手順を解説します。データウェアハウスについて網羅的に把握できる内容になっているので、ぜひ参考にしてください。

データウェアハウスとは?活用シーンについても解説

データウェアハウスの概要と活用シーンを解説します。用語の意味を理解して、知識として今後に役立てましょう。

データウェアハウスとはデータを保管しておく「倉庫」

データウェアハウスは、業務に関連するデータを保管する情報管理システムの1種です。英語表記では、Data Ware Houseと書かれており、頭文字を取ってDWHとも呼ばれています。データウェアハウスは、複数のシステムからデータを収集・保管・分析しています。データウェアハウスの主な構成要素は、以下の3つです。

  • RDB:データを保存・管理する
  • 変換システム:入力ルールや形式が違うデータを集約する
  • 人工知能・マイニングシステム:集約したデータを分析する

また、データウェアハウスは、コンピューターサイエンティストであるWilliam H.Inmon氏によって「データウェアハウスは、意志決定のため、目的別に編成され、統合された時系列で、削除や更新しないデータの集合体」と定義されています。

データウェアハウスの活用シーン

データウェアハウスは、幅広いさまざまな分野・産業で活用されています。データウェアハウスの活用シーンの例は、以下の通りです。

分野 活用内容 メリット
小売店のPOSシステム 商品の仕入れ 顧客動向の確認 経営判断への活用
ECサイト 購買・出品傾向の分析
顧客応対の品質管理
不正行為の監視
サービス品質向上 売上向上
航空会社・テーマパーク・映画館・ 過去の顧客データを分析 顧客のキャンセル傾向を把握 座席の空席率改善
Maas(レベル4 ) アプリ開発 目的地までのルート検索 移動手段の予約

Looker と Tableauを比較

Looker と Tableauを比較
特徴・機能面・運用・アクセス権の違いとは?

本資料でご紹介するポイント

  • Looker と Tableauの違い
  • Looker と Tableauを比較

資料ダウンロード

データウェアハウスの4つの特徴

データウェアハウスの特徴は、以下の4つです。

  • 主題指向性
  • 統合性
  • 時系列性
  • 不揮発性

特徴を把握して、データウェアハウスの理解を深めましょう。

主題指向性

データウェアハウスは、特定の主題(サブジェクト)を分析できる点が特徴です。サブジェクトは、顧客や商品などのデータとしてまとまった特性や分野の軸を表します。従来は、システム別にデータが集約されていましたが、データウェアハウスの登場により、システム間を横断してデータを取り扱えるようになりました。

データウェアハウスは、サブジェクト別にデータをまとめて、システム間を越えたデータ分析が可能です。

統合性

データウェアハウスは、データの統合性に優れた情報管理システムです。複数のシステムからデータを収集して、統合できます。システムが複数あれば、データの形式や入力ルールはシステムごとに異なります。データウェアハウスでデータをまとめて管理するには、収集したデータの形式や入力ルールを統一しなければなりません。

データウェアハウスは、データの形式や入力ルールを統一して、重複するデータを削除できます。データが統合されれば、収集したデータが整理されて、分析・活用しやすくなります。

時系列性

データウェアハウスは、過去から現在までのデータを時系列で保管可能です。処理速度の速さを重視した情報管理システムは、時間の経過によってデータが更新されて、最新の情報のみ保管されます。情報処理の速さは魅力ですが、過去のデータを活用した分析をする場合には向きません。データウェアハウスは、過去のデータを保管しているため、データの時間経過による変化を分析する際に便利です。

不揮発性

データウェアハウスは、保管したデータを削除・更新せずに、永続的に保管します。時系列性があるため、過去データと最新データを別々に保管する仕組みです。システムの運用にかかわらず、必要なデータをいつでも遡って閲覧できます。基本的にデータの削除・更新はしませんが、システム内の記憶容量を越える場合に、不要と判断されるデータを削除する場合があります。

データウェアハウスとほかの情報システムとの違い

データウェアハウスと4つの情報システムを比較して、それぞれの特徴を解説します。データウェアハウスとの違いを確認して、導入を検討する際の参考にしましょう。

データマート

データマートは、データの利用目的や用途に応じて必要なものを抽出し、活用しやすい状態に加工して保管する情報管理システムです。データウェアハウスとは、保管するデータの範囲が異なります。データマートは一部のデータのみを保管しますが、データウェアハウスは全社単位でデータを収集・統合・保管します。

データレイク

データレイクは、データのサイズ、種類などにかかわらず、さまざまなデータを加工せずに保管する情報管理システムです。複数のシステムからデータを収集する点は、データウェアハウスと同じですが、さまざまなデータ形式が保管されるデータレイクとは異なります。データウェアハウスは、データを統合して活用しやすい形に加工する情報管理システムです。

データベース

データベースは、情報管理システムの全般を表す用語です。データウェアハウスは、データベースの1種にあたります。システムを越えてサブジェクト別にデータを収集・保管・分析できるため、詳細な分析をする場合に向いています。高度な分析を簡単にできるように開発された情報管理システムです。

データベースは、基礎的なデータ操作を指すCRUD操作に優れている特徴があります。データウェアハウスとデータベースの違いは、保管するデータの種類です。データベースでは常に最新の情報しか保管されませんが、データウェアハウスには過去のデータから最新のデータまで保管されています。

BI

BIは、データマートやデータウェアハウスなどの情報管理システムにあるデータを分析するツールです。Business Intelligenceの頭文字を取っています。BIは、レポート作成をはじめとしたデータの可視化に優れた機能を備えているツールです。

BIとデータウェアハウスでは、データを扱う上での役割が異なります。BIは、情報管理システムに保管されたデータを分析するのに対して、データウェアハウスは、データを統合して蓄積する役割があります。

Looker

データウェアハウスの構築手順【4ステップ】

データウェアハウスの構築手順は、以下の4つです。

  • 要件定義
  • 設計
  • 実装
  • 運用

構築手順を把握して、導入する際の知識として参考にしましょう。

要件定義

データウェアハウスを構築する際の最初のステップは、要件定義です。社内全体のシステムにアクセスするデータウェアハウスは、さまざまな人が関わります。意思決定者、部署、ITチームなどの人に意見を聞いて、内容を整理した上で、要件定義をしなければなりません。部署や事業全体の目標もしくは業務において、どのような種類のデータを扱っているかを確認して、社内におけるニーズの把握をしましょう。

設計

データウェアハウスの設計段階では、最低限決めるべき以下の項目があります。

  • システム環境:クラウド、オンプレミス、ハイブリッドのどれにするか
  • データモデル(スキーマ):データの格納方法はどうするか
  • ETLソリューション(※1):各システムとデータウェアハウスをどのように接続するか
  • フロントエンド:データウェアハウスユーザーに、データ分析結果をどのようにわかりやすく伝えるか

※1.ETLソリューション:社内外にあるデータを抽出して、用途に応じてデータを変換・加工した後に、保管先に書き出すために使用するプロセス

実装

データウェアハウスの実装段階で行う作業は、以下の通りです。

  1. データウェアハウスの設計内容に適したソフトウェアとサーバーを購入もしくは開発する
  2. ETLシステム(※1)を使って各システムからデータを抽出する
  3. BIツールをデータウェアハウスと連携する

自社にデータウェアハウスに関する知見のある人材がいない場合は、外注も含めて検討しましょう。

※1.ETLシステム:社内外にあるデータを抽出して、用途に応じてデータを変換・加工した後に、保管先に書き出すためのシステム

運用

データウェアハウスの利用を開始します。運用を開始した後は、定期的にシステムの監視と評価を行いましょう。システムや収集されたデータ品質に問題がないかを確認します。また、システムの能力向上に役立てる目的で、使用状況も定期的に計測しましょう。運用していくなかで、必要に応じてシステムの更新も必要です。

データウェアハウスを導入するならGoogleの「BigQuery」

近年、データドリブン経営に企業の注目が集まっています。データドリブン経営を支えるデータウェアハウスの需要も増えており、実際に導入する企業も現れています。自社にデータウェアハウスを導入したい場合は、Googleの「BigQuery」がおすすめです。

BigQueryには、データの高速処理を可能にするカラム型データストアとツリーアーキテクチャの2つの仕組みが採用されており、クラウドサービスのなかでもトップクラスの高速分析を可能にしています。また、データベースに関する専門知識がなくても、大規模なデータを分析可能です。直感的に画面を操作して、データの分析ができます。BigQueryについてさらに知りたい方は、以下のページをご覧ください。

データウェアハウスについて理解して効果的なデータ分析をしよう

データウェアハウスは、業務システムからデータを収集して保管する情報管理システムの1種です。近年では、データドリブン経営、POSシステム、ECサイトなどで活用されています。データウェアハウスの特徴は、以下の4つです。

  • 主題指向性
  • 統合性
  • 時系列性
  • 不揮発性

データウェアハウスは、システム間を横断してデータを収集・管理できるため、より多くのデータから分析できます。統合性にも優れており、システムごとで異なるデータの形式や入力ルールを統一して整理可能です。また、過去のデータと最新のデータを時系列で保管できるため、時間経過による変化を分析できます。

データウェアハウスによって収集されたデータは、削除されずにシステム内で保管され、いつでも必要なタイミングで閲覧できます。自社でデータウェアハウスの導入を検討している場合は、Googleの「BigQuery」がおすすめです。BigQueryは、利用料が安く、高速でデータ処理ができます。BigQueryを使ったデータドリブン経営に興味がある方は、以下の資料をぜひご覧ください。

BigQueryで始めるデータドリブン経営

RELATED POST関連記事


RECENT POST「Looker」の最新記事


Looker

データウェアハウス(DWH)とは?メリット・活用例を紹介

Looker

データレイクとデータウェアハウスの違いとは?

Looker

【2大DWH】BigQueryとRedshiftを徹底比較!

Looker

今話題のデータレイクとは?構築方法とDWHの違いを解説

データウェアハウス(DWH)の特徴4選!構築方法やおすすめのツールについても解説