<img height="1" width="1" style="display:none" src="https://www.facebook.com/tr?id=220807558931713&amp;ev=PageView&amp;noscript=1">

【2大DWH】BigQueryとRedshiftを徹底比較!

 2021.09.08  株式会社電算システム

情報爆発時代と呼ばれる現代社会において、企業が市場の競争優位性を確立するためには、情報管理の最適化が不可欠です。そこで重要となるのが「データウェアハウス」です。本記事では、データウェアハウスサービスとして高い人気を誇る、「BigQuery」と「Redshift」の機能や相違点などについて解説します。

データウェアハウスとは

「データウェアハウス」とは、組織の意思決定の支援に使用される、大規模なビジネスデータの分析システムです。「Data Warehouse」の頭文字をとって「DWH」とも呼ばれます。

データウェアハウスは、現代の企業経営において不可欠となりつつある、データ分析基盤の一要素です。データ分析は情報の収集・蓄積に始まり、そして分析から可視化へと至ります。この一連のプロセスを、「データレイク」「データウェアハウス」「データマート」という3層構造のシステムによって実行します。データウェアハウスは、データ分析基盤の3層構造の中間に位置し、構造化されたデータのみを格納するリポジトリです。

データウェアハウスがもつ最も大きな特徴は、データの集約と検索に最適化された分析基盤である点です。収集した膨大なデータを時系列で整理し、情報に加工や変換を施して構造化したうえで、分析しやすい状態で保管する役割を担います。データの倉庫のような役割をもつことが、「Data Warehouse(情報の倉庫)」と呼ばれる所以です。

データレイクであらゆるデータを収集し、データウェアハウスで情報を統合して構造化、そしてデータマートで用途に合ったデータを抽出するのが、データ分析に用いられる一連のフローです。膨大な情報を最適化し、迅速な意思決定や経営戦略の策定に寄与するシステムです。
 
花王株式会社様 導入事例
BigQueryで始めるデータドリブン経営

BigQueryとは

「BigQuery」とは、Google社が提供するクラウドサービスで、PB単位のデータに対するスケーラブルな分析を可能にするデータウェアハウスです。

BigQueryの大きな特徴としては、カラム指向なデータ配置とツリーアーキテクチャが挙げられます。この2つの仕組みによって、トラフィックの最小化と圧縮効率の上昇を実現し、超高速でのデータ分析が可能です。数TBあるいはPBに及ぶデータセットに対し、数秒~数十秒程度で高度な分析結果を導き出せます。世界中に巨大なデータセンターを所有し、世界最大規模のコンピュータシステムを運用するGoogle社ならではのサービスといえるでしょう。
 

Redshiftとは

「Redshift」とは、「AWS(アマゾン・ウェブ・サービス)」が提供するクラウド型のデータウェアハウスサービスです。SQLに対応し、高速処理や堅牢なセキュリティ管理を実現します。

Redshiftの最大の特徴は、圧倒的なコストパフォーマンスです。たとえば、従来のデータウェアハウス製品を導入する場合、数TBの容量でも億単位の費用が必要になるケースも珍しくありません。しかし、Redshiftは、テラバイトあたりの価格を従来製品の約1/10以下に抑えることが可能です。また、クラウド型のデータウェアハウスサービスなので、システムの保守・管理業務が不要になるため、運用コストの大幅な削減に貢献します。
 
Google Cloud 事例
Google Cloud

BigQueryとRedshiftを比較

ITシステムを活用するうえで最も重要なポイントは、自社の企業規模や事業形態に合ったソリューションを導入することです。そのためには、それぞれのシステムがもつ特徴を知る必要があるでしょう。ここでは、BigQueryとRedshiftの相違点について解説します。
 

基本的な違いについて

BigQueryとRedshiftは、双方ともに世界を席巻する4大企業「GAFA」のサービスであり、同じデータウェアハウスでありながら、それぞれが異なる特徴を備えています。たとえば、先述したように、まずは処理速度に違いがあります。Redshiftでも高速処理はできますが、BigQueryのほうがより速く大量のデータ処理が可能です。


また、BigQueryとRedshiftでは料金システムも異なります。BigQueryはサーバーレスで処理したデータ量によって料金が決まり、Redshiftはサーバレス課金のAmazon Redshift Spectrumというサービスもありますが、基本的には個別にインスタンスを必要とし、利用時間によって料金が決まります。


これからデータ分析を始める方で、スモールスタートでの開始を考えている方は、データ量で料金が決まるBigQuery の方が導入しやすいといえるでしょう。使用頻度など、利用状況に適した料金システムを選ぶことをおすすめします。

さらに、Redshiftは使用目的に合わせた詳細設定が必要ですが、BigQueryなら、エンジニア知識を必要とするような設定をしなくてもすぐに使用することができます。BigQueryは必要な時にすぐに利用可能なので、使いやすさも抜群です。
 

RedshiftとBigQueryの比較

■「BigQuery」
SQL:標準SQL
インデックス:なし
パーティション:あり
データ格納方式:列指向
マルチバイト対応文字:なし
クエリの実行環境:ブラウザUI
入力データフォーマット:Avro、CSV、JSON、ORC、Parquet、
出力データフォーマット:Avro、CSV、JSON、Parquet、
連携可能なストレージ:Google Cloud Storage、Google Drive
料金体系:クエリ課金(※定額プランあり)

■「Redshift」
SQL:標準SQL
インデックス:あり
パーティション:なし
データ格納方式:列指向
マルチバイト対応文字:あり
クエリの実行環境:コマンドライン
入力データフォーマット:Avro、CSV/TSV、JSON
出力データフォーマット:CSV/TSV
連携可能なストレージ:Simple Storage Service
料金体系:時間課金(※クエリ課金プランあり)

BigQueryを利用できるサービスGoogle Cloud™ とは

Google Cloud Platform(旧GCP:Google Cloud  Platform)」とは、Google社がクラウド上で提供するサービスの総称です。高性能な仮想マシンや機械学習を活用したビッグデータ分析、低コストでのアプリケーション開発など、さまざまなサービスを提供しています。前述の BigQuery も、Google Cloud に含まれるソリューションのひとつです。

ほかにも、フルマネージド型のサーバーレス・プラットフォーム「Google App Engine」や、機械学習ソリューション「Cloud ML Engine」などが代表的なサービスとして挙げられます。このようにGoogle Cloud は、複数のデータ分析ソリューションを備えているため、1つのプラットフォームで最適化された情報管理基盤の構築が可能です。データウェアハウスの導入をお考えの際は、ぜひ検討されてみてはいかがでしょうか。
 

まとめ

近年、企業が創出する情報量は指数関数的に増大し、市場競争性は激化の一途を辿っています。このような社会背景のなか、企業が新たな市場価値を創造するためには、情報管理の最適化が不可欠です。データウェアハウスを導入し、社内に散在している膨大なデータを統合管理することで、イノベーションの創出へとつながるでしょう。

BigQueryとRedshiftは、いずれも高い市場シェアを誇るデータウェアハウスです。この2つは、どちらが優れているというものではなく、それぞれにメリットとデメリットがあります。ITシステムの活用では、自社の企業規模や事業形態に応じたサービスを導入することが肝要です。ぜひ、本記事を参考にして自社の経営戦略にご活用ください。

また、BigQueryを利用できるGoogle Cloud は、株式会社電算システム(DSK)で導入支援を行っています。データ分析基盤の構築をお考えの方は、無料の相談から受け付けておりますので、お気軽にご相談下さいませ。
CTA

RELATED POST関連記事


RECENT POST「Google Cloud (旧GCP)」の最新記事


Google Cloud (旧GCP)

データウェアハウスとデータベースとの違いは?導入のポイントを解説

Google Cloud (旧GCP)

データレイクとデータウェアハウスの違いとは?

Google Cloud (旧GCP)

データウェアハウス(DWH)とは?メリット・活用例を紹介

Google Cloud (旧GCP)

データマートとは?データウェアハウスとの違いを徹底解説

【2大DWH】BigQueryとRedshiftを徹底比較!