<img height="1" width="1" style="display:none" src="https://www.facebook.com/tr?id=445779107733115&amp;ev=PageView&amp;noscript=1">

SnowflakeとBigQueryを比較、メリットと選定基準を解説

 2022.02.28  2023.02.22

ここ数年ビッグデータの活用サービスは増え続けており、選定に頭を悩ませるシステム担当者は多いでしょう。本記事では、データ分析に利用されるクラウド型データウェアハウスの「Snowflake」と「BigQuery」の料金や機能を比較します。

データウェアハウスとは

データウェアハウスとは、複数の基幹系システムのデータを収集し、目的別に再構成した統合データベース(格納庫)のことです。データは目的別に並べられ、削除や更新はされません。膨大な明細データをそのまま時系列で蓄積し続けます。

代表的なデータウェアハウスの分析結果に「おむつとビールの相関関係」があります。仕事帰りの父親が、頼まれた買い物(この場合はおむつ)とビールを一緒に買って帰るというものです。この事例は「事実ではない」とも言われていますが、データウェアハウスの活用やビッグデータ解析の重要性について表した好例として、広く知られています。

このように、データウェアハウスは多数の情報源からデータを蓄積するため、異なるデータベースにある相関関係の分析に役立ちます。

従来は企業内の各サーバに格納されていたデータをオンプレミス上で集約し分析するケースが多かったのですが、昨今はクラウド上に構築されたデータウェアハウスをSaaSとして利用するケースが増えています。クラウド上のデータウェアハウスを利用することで、従来型に比べコスト削減や処理スピードのアップが見込めるため、機会を逃さず、迅速な意思決定が実現します。

花王株式会社様 導入事例
freee株式会社様導入事例

Snowflakeとは

「Snowflake」は、2012年創業、2019年末に日本法人が設立されたSnowflake Inc.が提供するクラウド型データウェアハウスサービスです。全世界で3,000を超える企業が利用していて、Amazonの「Redshift」や、Googleの「BigQuery」に匹敵するデータウェアハウスとして、今後が期待されています。

コンピュートリソース(仮想的な機器)とストレージリソースが分離しているので、負荷が分散され、同時に複数のデータ処理が可能です。コンピュートリソースは必要なときに必要な分だけ利用できます。

複数のクラウドにまたがりデータをレプリケーション(複製)できるので、特定のプロバイダに障害が発生しても、中断することなくサービスを継続できます。ユーザー企業が利用しているツールをそのまま利用できるので、導入のハードルが低い点も特徴です。

BigQueryとは

「BigQuery」はGoogleが提供するクラウド型のデータウェアハウスです。Google社内で使っていた大規模なクエリを実行する「Dremel(ドレメル)」を、外部ユーザー向けに改良したもので、Google Cloud に含まれます。

最大の特徴はデータ処理の速さです。数TB(テラバイト)〜数PB(ペタバイト)のデータを数十秒〜数分でフルスキャンし、分析結果を即座に表示することができます。この処理は、行単位ではなく列単位でデータが保存される「カラム型データストア」と、ルートサーバーから複数のサーバーに対してクエリが広がる「ツリー構造」により実現されています。

分析を行う際の言語として標準SQLをサポートしているので、さらにはBigQuery ML と呼ばれる周辺機能により機械学習モデルの作成も使い慣れたSQLで実施できます。これにより、データ分析のみならず機械学習を行う際の学習コストも抑えられるでしょう。

Google Cloud 事例
Google Cloud

SnowflakeとBigQueryを比較

SnowflakeとBigQueryはそれぞれ異なるメリットを持ちます。料金や機能を比較しながら、自社の利用状況に合わせてサービスを比較してみてください。

料金体系

料金は条件により大きく異なるため、あくまで参考値としてください。どちらもコンピュート(分析)とストレージそれぞれに料金が設定されています。ストレージ価格はSnowflakeよりBigQuery、コンピュート価格(分析料金)は、容量にもよりますがSnowflakeの方が有利になるケースが多いでしょう。詳細は以下の通りです。

Snowflakeのストレージ価格は1TBあたりキャパシティ(事前購入)で23ドル/月、オンデマンド(従量課金)は40ドル/月です。コンピュート価格は4つのエディションがあり、最も安いスタンダード価格は1クレジット(≒1時間あたりに利用するマシンスペック単価)あたり2ドル(AWSホスティングに基づく)です。(金額はいずれもUSリージョンのもの)

BigQueryのストレージの価格は毎月10GB(ギガバイト)まで無料、以降はアクティブ ストレージで1TBあたり23ドル/月、長期保存は16ドル/月です。コンピュート価格は毎月最初の1TBクエリは無料、以降は1TBあたり6ドル、定額料金なら月額定額料金は100スロット2,400ドル/月、年額定額料金は100スロット2,040ドル/月です。(金額はいずれも東京リージョンのもの)

パフォーマンスと使いやすさ

Gigaom社が2019年に行ったベンチマークテストによると、30TBのデータセットを計103回実施するのにSnowflakeは5,793秒、BigQueryは37,283秒を要しました。

しかし、すべてのユースケースにおいてこの結果が適応されるわけではありません。米テックメディアのGigaOmによれば、パフォーマンスの最も高い項目から最も低い項目を含む、総合的なベンチマークテストにおいては、SnowflakeよりもBigQueryが優れていると評価されています。

https://gigaom.com/report/cloud-data-warehouse-performance-testing/

使いやすさにおいては、サーバーレスのBigQueryに軍配が上がるでしょう。データを一度アップロードしてしまえば、ユーザーは長い設定プロセスを踏むことなく、すぐにBigQueryを使用開始できます。

BigQueryを利用できるサービスGoogle Cloud(旧GCP:Google Cloud Platform )とは

Google Cloud は、Google がクラウド上で提供するサービスの総称です。高性能な仮想マシン、機械学習を活用したビッグデータ分析、低コストでのアプリケーション開発など、50〜100種類以上の豊富なサービス群で構成されています。

Google Cloudに含まれるBigQueryは、データのログ解析や、機械学習を取り入れてシステムを作成したいときに便利です。例えば、BigQueryにGoogleアナリティクスの会員データと既存のBIツールを連携させれば、「誰が・いつ・どこで・どのページに・どのくらい滞在したか」などがすぐに把握できるようになります。

まとめ

Google CloudのBigQuery活用により、データ統合とBI構築が実現します。しかし、BigQueryは従量課金制のため、接続前のデータチェックやクエリをさらに分別するスリム化が必要です。

株式会社電算システム(DSK)ではGoogle Cloud資格所有者により、BigQuery環境がスムーズに継続実行できるサービスを提供しています。Google Cloudと企業を強固に連携させ、ビジネスの発展と成長を総合的に支援します。

GCP総合ブローシャー

RELATED POST関連記事


RECENT POST「Google Cloud(GCP)」の最新記事


Google Cloud(GCP)

【2大DWH】BigQueryとRedshiftを徹底比較!

Google Cloud(GCP)

データウェアハウス(DWH)とは?メリット・活用例を紹介

Google Cloud(GCP)

BigQueryの外部データソース機能を活用したデータ分析基盤の構築方法をご紹介!

Google Cloud(GCP)

今話題のデータレイクとは?構築方法とDWHの違いを解説

SnowflakeとBigQueryを比較、メリットと選定基準を解説