Google CloudやAWS、Microsoft Azureなど、さまざまなクラウドサービスを併用してデータ分析を行っている場合、BigQuery Omniの活用がおすすめです。
同サービスを活用すると、AWSとMicrosoft Azureのデータを、Googleが提供するBigQuery内に一元化できます。結果、クラウドサービス間のデータを活かしつつ、より迅速なクエリの実行が可能です。
本記事では、BigQuery Omniの概要やメリット、料金プランを解説します。具体的な使い方についても紹介していますので、ぜひ参考にしてください。
Google BigQuery Omniとはマルチクラウドでの分析が可能なサービス
まずはBigQuery Omniの基礎知識を解説します。
BigQuery Omniの概要
BigQuery Omniとは、Googleのクラウド型DWH(データウェアハウス)「BigQuery(ビッグクエリ)」の発展モデルです。
AWSのS3データやMicrosoft AzureのBlob StorageデータをBigQuery内に格納し、単一のシステムでクエリを実行できる点に特徴があります。データの格納場所を指定するだけで実装できる手軽さが魅力です。
BigQuery Omniが生まれた背景
BigQuery Omniが誕生する以前は、BigQueryとAWS・Microsoft Azureを連携する場合、データをGoogle Cloudに転送する必要がありました。その場合、Google Cloud Storageにデータを集約したり、BigQueryのテーブルにデータをコピーしたりと、どうしても手間や時間がかかってしまうのが難点です。
しかし、データ連携に多大な工数がかかるとはいえ、Google CloudやAWSといった単一のシステムのみでマルチクラウド環境を構築することはできません。そこで、複数のクラウドサービスを使いつつ、よりスムーズなデータ連携を行えるBigQuery Omniがリリースされました。
BigQuery Omniでは、AWSやMicrosoft AzureのデータをBigQueryにコピーせず、よりスムーズで迅速なクエリの実行が可能です。そのため、マルチクラウド環境を構築する際に欠かせないツールだといえるでしょう。
BigQuery Omniを導入する3つのメリット
BigQuery Omniを導入する際は、ツール実装による具体的な費用対効果をイメージすることが重要です。以下で紹介する3つのメリットをもとに、前もって導入効果を検証しましょう。
- 費用の削減や最適化につながる
- クエリの一元管理ができる
- よりスムーズな意思決定が可能
費用の削減や最適化につながる
BigQuery Omniでは、BigQuery内でAWSやMicrosoft Azureのデータを処理できます。システム間のデータ転送が不要になるため、ネットワークの下り料金の削減につながります。
また、BigQuery内でAWSやMicrosoft Azureのクエリを実行しても、AWSやMicrosoft Azureのアカウントで追加料金を請求されることはありません。BigQueryで実行したクエリはすべて、Googleの価格モデルが適用されるためです。結果として、データ転送にかかる不要な費用が抑えられるため、コストの最適化にも効果を発揮するでしょう。
クエリの一元管理ができる
BigQuery内で処理したAWSやMicrosoft Azureのデータは、Google Cloudの管理コンソールに統合されます。1ヶ所でBigQuery・AWS・Microsoft Azureのクエリを一元管理できるのがメリットです。
クエリを実行する際は、Google以外の外部システムにアクセスする必要がありません。そのため、ユーザー側のストレスやフラストレーションが溜まるリスクを抑制できます。
よりスムーズな意思決定が可能
BigQueryで実行したクエリの分析結果は、Google Looker Studioを介して即座に可視化されます。そのため、AWSやMicrosoft Azureにアクセスしたり、他社の分析ツールを経由したりする必要がなく、よりスムーズな分析につながるのが利点です。
分析結果を迅速に把握できれば、より効率的な意思決定が可能です。特に、迅速なPDCAサイクルの回転が求められるマーケティングやインサイドセールスの領域では、BigQuery Omniが進化を発揮します。
【AWS編】BigQuery Omniの使い方・接続方法
BigQuery Omniの使い方について、まずはAWS S3を利用する場合の設定方法を解説します。詳細な手順は次の通りです。
- AWSでS3パケットを新たに作成し、ARN情報を取得する(「米国東部(バージニア北部)us-east-1」のリージョンを選択)
- 作成したパケットのIAMポリシーを作成する
- Google Cloudで利用するためのIAMロールを作成し、IAMポリシーを付与する
- BigQueryでデータソースとデータセットを作成し、AWSのIAMロールに即して設定を行う
- スキーマ情報が自動的に検出されているかを確認する
【Microsoft Azure編】BigQuery Omniの使い方・接続方法
Microsoft AzureのBlob Storageデータを用いる場合は、次の手順でBigQuery Omniと接続します。
- Microsoft Azureで新たなストレージアカウントを作成する(「(US) East US 2」のリージョンを選択)
- BigQueryでデータソースを作成する
- Microsoft AzureでストレージアカウントのIAM設定を行う
- BigQueryでデータセットを作成し、Microsoft AzureのIAMロールに即して設定を行う
- BigQueryで外部テーブルを作成して接続IDやスキーマの設定を行う
- スキーマ情報が自動的に検出されているかを確認する
BigQuery Omniの料金プラン
BigQuery Omniの料金体系は、「オンデマンドプラン」と「定額プラン」の2種類に分かれます。TiB単位またはスロット単位で課金形態を選択できるため、それぞれの特徴を把握しましょう。
オンデマンドプラン
オンデマンドプランは、クエリ実行のためにスキャンしたデータに対して課金する仕組みです。TiB単位で料金が発生します。同じリージョンでもAWSとMicrosoft Azureで価格が異なるため、注意が必要です。
リージョン | TiBあたりの料金 |
AWS North Virginia(aws-us-east-1) | $7.82 |
Azure North Virginia(azure-eastus2) | $9.13 |
AWS Seoul(aws-ap-northeast-2) | $10.00 |
AWS Oregon(aws-us-west-2) | $7.82 |
AWS Ireland(aws-eu-west-1) | $8.60 |
キャッシュから取得した結果やエラー結果に対しては課金されません。ただし、リージョンの範囲内で競合が増えて容量が増大すると、利用できるスロット数が少なくなる可能性があります。
オンデマンドプランは従量課金制で費用が決まるため、費用対効果が悪化するリスクを抑えられるのがメリットです。
定額プラン
定額プランは、利用するスロット数に応じて固定料金が定められています。
契約期間 | 1時間あたりの料金 | スロット数 |
1年契約 | $6.00 | 100スロット |
3年契約 | $4.50 | 100スロット |
※リージョン「AWS North Virginia(aws-us-east-1)」のケース
契約期間を定めずに利用する場合は、100スロットあたり$7.50の料金が発生します。この場合、最小課金時間は1分で、秒単位で課金される仕組みです。
BigQuery Omniで理想的なマルチクラウド環境を構築しよう
普段からGoogle Cloud・AWS・Microsoft Azureを組み合わせて活用する方は、BigQuery Omniを使ってクエリ処理の効率性を高めましょう。BigQuery Omniを活用すれば、AWSのS3データやMicrosoft AzureのBlob StorageデータをBigQueryに取り込み、スムーズなクエリの実行が可能なので、大きな手間をかけることなくマルチクラウド環境が実現します。
また、将来的にクラウド環境を拡張したい場合にも同ツールが役立ちます。
Google Cloud・AWS・Microsoft Azureの特徴や機能を知りたい方は、ぜひ以下の資料を参考にしてください。比較表を用いて各サービスの特徴を紹介しているため、どのようにそれぞれの利点を活かすべきかがわかります。
- カテゴリ:
- Google Cloud(GCP)
- キーワード:
- bigquery omni