<img height="1" width="1" style="display:none" src="https://www.facebook.com/tr?id=220807558931713&amp;ev=PageView&amp;noscript=1">

SnowflakeとBigQueryを比較、メリットと選定基準を解説

 2021.09.27  株式会社電算システム

ここ数年ビッグデータの活用サービスは増え続けており、選定に頭を悩ませるシステム担当者は多いでしょう。本記事では、データ分析に利用されるクラウド型データウェアハウスの「Snowflake」と「BigQuery」の料金や機能を比較します。

データウェアハウスとは

データウェアハウスとは、複数の基幹系システムのデータを収集し、目的別に再構成した統合データベース(格納庫)のことです。データは目的別に並べられ、削除や更新はされません。膨大な明細データをそのまま時系列で蓄積し続けます。

代表的なデータウェアハウスの分析結果に「おむつとビールの相関関係」があります。仕事帰りの父親が、頼まれた買い物とビールを一緒に買って帰るというものです。この事例は「事実ではない」とも言われていますが、データウェアハウスの活用やビッグデータ解析の重要性について表した好例として、広く知られています。
このように、データウェアハウスは多数の情報源からデータを蓄積するため、異なるデータベースにある相関関係の分析に役立ちます。

従来は企業内のサーバーに格納されていましたが、昨今はクラウド上に構築されたデータウェアハウスをSaaSとして利用しています。従来型に比べコスト削減や処理スピードのアップが見込めるため、機会を逃さず、迅速な意思決定が実現します。

花王株式会社様 導入事例
BigQueryで始めるデータドリブン経営

Snowflakeとは

「Snowflake」は、2012年創業、2019年末に日本法人が設立されたSnowflake Inc.が提供するクラウド型データウェアハウスサービスです。全世界で3,000を超える企業が利用、Amazonの「Redshift」や、Googleの「BigQuery」に匹敵するデータウェアハウスとして、今後が期待されています。

コンピュートリソース(仮想的な機器)とストレージリソースが分離しているので、負荷が分散され、同時に複数のデータ処理が可能です。コンピュートリソースは必要なときに必要な分だけ利用できます。

複数のクラウドにまたがりデータをレプリケーション(複製)できるので、特定のプロバイダに障害が発生しても、中断することなくサービスを継続できます。ユーザー企業が利用しているツールをそのまま利用できるので、導入のハードルが低い点も特徴です。

BigQueryとは

「BigQuery」はGoogleが提供するクラウド型のデータウェアハウスです。Google社内で使っていた大規模なクエリを実行する「Dremel(ドレメル)」を、外部ユーザー向けに改良したもので、Google Cloud™(旧 GCP:Google Cloud Platform)に含まれます。

最大の特徴はデータ処理の速さです。数TB(テラバイト)〜数PB(ペタバイト)のデータを数十秒〜数分でフルスキャンできます。この処理は、行単位ではなく列単位でデータが保存される「カラム型データストア」と、ルートサーバーから複数のサーバーに対してクエリが広がる「ツリー構造」により実現します。

標準SQLをサポートしているので、機械学習モデルの作成も使い慣れたSQLで実施できます。同時に、学習コストも抑えられるでしょう。

Google Cloud 事例
Google Cloud

SnowflakeとBigQueryを比較

SnowflakeとBigQueryはそれぞれ異なるメリットを持ちます。料金や機能を比較しながら、自社の利用状況に合わせてサービスを比較してみてください。

料金体系

料金は条件により大きく異なるため、あくまで参考値としてください。どちらもコンピュート(分析)とストレージそれぞれに料金が設定されています。ストレージ価格はSnowflakeよりBigQuery、コンピュート価格(分析料金)は、容量にもよりますがSnowflakeの方が有利になるケースが多いでしょう。詳細は以下の通りです。

Snowflakeのストレージ価格は1TBあたりキャパシティ(事前購入)で23ドル/月、オンデマンド(従量課金)は40ドル/月です。コンピュート価格は7つのエディションがあり、最も安いスタンダード価格は1時間あたり2ドル、または1時間あたり1クレジット(AWSホスティングに基づく)です。(金額はいずれもUSリージョンのもの)

BigQueryのストレージの価格は毎月10GB(ギガバイト)まで無料、以降はアクティブ ストレージで1TBあたり23ドル/月、長期保存は16ドル/月です。コンピュート価格は毎月最初の1TBクエリは無料、以降は1TBあたり6ドル、定額料金なら月額定額料金は100スロット2.4ドル/月、年額定額料金は100スロット2.04ドル/月です。(金額はいずれも東京リージョンのもの)

パフォーマンスと使いやすさ

Gigaom社が2019年に行ったベンチマークテストによると、30TBのデータセットを計103回実施するのにSnowflakeは5,793秒、BigQueryは37,283秒を要しました。

しかし、すべてのユースケースにおいてこの結果が適応されるわけではありません。米テックメディアのGigaOmによれば、パフォーマンスの最も高い項目から最も低い項目を含む、総合的なベンチマークテストにおいては、SnowflakeよりもBigQueryが優れていると評価されています。

https://gigaom.com/report/cloud-data-warehouse-performance-testing/

使いやすさにおいては、サーバーレスのBigQueryに軍配が上がるでしょう。データを一度アップロードしてしまえば、ユーザーは長い設定プロセスを踏むことなく、すぐにBigQueryを使用開始できます。

BigQueryを利用できるサービスGoogle Cloud(旧GCP:Google Cloud Platform )とは

Google Cloud は、Google がクラウド上で提供するサービスの総称です。高性能な仮想マシン、機械学習を活用したビッグデータ分析、低コストでのアプリケーション開発など、50種類以上の豊富なサービス群で構成されています。

Google Cloudに含まれるBigQueryは、データのログ解析や、機械学習を取り入れてシステムを作成したいときに便利です。例えば、BigQueryにGoogleアナリティクスの会員データと既存のBIツールを連携させれば、「誰が・いつ・どこで・どのページに・どのくらい滞在したか」などがすぐに把握できるようになります。

まとめ

Google CloudのBigQuery活用により、データ統合とBI構築が実現します。しかし、BigQueryは従量課金制のため、接続前のデータチェックやクエリをさらに分別するスリム化が必要です。

株式会社電算システム(DSK)ではGoogle Cloud資格所有者により、BigQuery環境がスムーズに継続実行できるサービスを提供しています。Google Cloudと企業を強固に連携させ、ビジネスの発展と成長を総合的に支援します。

CTA

RELATED POST関連記事


RECENT POST「Google Cloud(旧 GCP )」の最新記事


Google Cloud(旧 GCP )

データマートを設計する際に押さえておきたいポイントとは?

Google Cloud(旧 GCP )

データウェアハウスとデータベースとの違いは?導入のポイントを解説

Google Cloud(旧 GCP )

データウェアハウス(DWH)とは?メリット・活用例を紹介

Google Cloud(旧 GCP )

【2大DWH】BigQueryとRedshiftを徹底比較!

SnowflakeとBigQueryを比較、メリットと選定基準を解説