ビッグデータ活用の必要性が注目を浴びる近年では、企業が扱うデータの量も膨大になっています。その状況下で必要な情報を素早く集めて分析し、企業が意思決定を迅速に行っていくために活用できるのが、データマートの構築です。本記事では、データマートの概要や種類、メリットについて解説します。
データマートとは?
データマートとは、組織に蓄積されたデータから各部門が目的に応じて一部の必要なデータだけを抽出し、利用に適した形に加工して格納したデータベースのことです。必要なデータだけを取り出すことで、分析に必要な情報を迅速に確認できます。
データマートは、組織の統合データベースであるデータウェアハウス(DHW)からデータを取り出したものであるケースが多いです。
データマートとデータウェアハウスの違い
データマートもデータウェアハウス(DWH)も、データを蓄積・保存しておくリポジトリー(保存場所)である点は同じです。
データマートは一部の必要なデータを目的に応じて抽出・格納したものであるのに対し、データウェアハウスは企業内の情報を網羅的に管理・格納したものである点が異なります。
データウェアハウスが巨大な「ウェアハウス(倉庫)」であるのに対し、データマートは「マート(小売店)」であるとイメージするとわかりやすいでしょう。
その他の具体的な違いは、以下のとおりです。両者の情報を整理して比較しました。
【データマート】
- サイズ:100GB未満(小さめ)
- テーマ:1つだけ
- 範囲:1部門
- データソース:いくつかのソース
- データ統合:1つ
- コスト・時間:比較的安い 分・週・月単位
【データウェアハウス】
- サイズ:100GB以上(大きい)
- テーマ:複数ある
- 範囲:会社(組織)全体
- データソース:多くのソース
- データ統合:すべてのビジネスデータ
- コスト・時間:比較的高い(クラウドサービス利用により削減可) 数ヵ月~数年単位
- <h2>データマートの種類</h2>
データマートは、データの抽出元によって以下の3つに分類することができます。
- ・従属型データマート
- ・独立型データマート
- ・ハイブリッド型データマート
- ここからは、3つのデータマートの特徴について解説します。
従属型データマート
従属型データマートとは、作成済みのデータウェアハウスからデータを抽出し作成されるデータマートです。
従属型データマートは、データウェアハウスの作成時に要約とフォーマット化が行われた「きれいな」データから抽出して作成されるため、プロセスが比較的簡素です。データマートの目的に適うデータのサブセットを特定したら、それらをコピーして移動させるという流れになることが多いです。
独立型データマート
独立型データマートとは、データウェアハウスには接続せずに作成されたスタンドアローン(孤立した)型のデータマートのことです。
独立型データマートの構築においては、データの業務系ソースと外部ソースの一方もしくは両方からデータを抽出します。
独立型データマートは、特定の目的に必要なデータさえ抽出できれば構築でき、手軽かつ迅速に導入できるため、特に短期的な目標の達成に適しています。
ハイブリッド型
ハイブリッド型データマートとは、既存のデータウェアハウスと他のデータベースを組み合わせてデータを抽出するタイプのデータマートです。
ハイブリッド型は、新しいデータを追加する場合や、より限定的な目的のためにデータベースを構築したい場合などに利用されます。
ハイブリッド型データマートは従属型と独立型の特徴を兼ね備えており、迅速さとエンタープライズレベルの統合メリットを併せ持っています。
データマートのメリット
ここからは、データマートを利用することのメリットについて解説します。
データウェアハウスではなくデータマートを利用してデータ分析を行うメリットは、コスト面とスピード面にあります。それぞれの詳細についてご説明します。
データウェアハウスの安価な代替
データマートのメリットとしてまず挙げられるのが、データウェアハウスと比較して構築にかかるコストを抑えられることです。
必要なデータセットが少なく、データウェアハウスを構築する必要性が低い場合は、データウェアハウスの安価な代替手段として活用できるでしょう。
データマートは設計がシンプルなことからセットアップに必要なスキルレベルが低く、比較的短期間で構築でき、独立型データマートであれば1週間以内に稼働させることもできます。
レスポンスの向上
データマートを利用するメリットの2つ目は、レスポンスの向上です。
目的に合わせてあらかじめ集計されているデータを活用することで、全体のデータ量を小さくすることができるため、分析のレスポンスを高められます。特に従属型とハイブリッド型のデータマートでは処理の負担が小さくなるため、データウェアハウスのパフォーマンスを向上させることができるでしょう。
レスポンスが向上すれば、データ分析にかかるコストも抑えることができます。
[RELATED_POSTS]
まとめ
データマートは目的に応じて必要なデータだけを抽出するもので、短期間かつ低コストでデータベースを構築できるリポジトリーの一種です。データマートはデータの抽出プロセスによって3つに分けられ、目標に合った利用をすることでコスト削減やレスポンスの向上などが期待できます。目的を明確にしてメリットが多いデータマートを活用してみてはいかがでしょうか。
また、電算システムでは、BI(ビジネスインテリジェンス)機能を搭載したデータプラットフォームとして、Lookerの活用をご提案しています。
Lookerを活用することで、データ分析の担当者だけでなく、作成したダッシュボードのURLを共有するだけで、簡単にユーザ部門でもドリルダウンでデータ分析が行うことが可能で、全社データドリブン基盤として企業の経営を力強くサポートします。
- カテゴリ:
- Looker
- キーワード:
- Looker