Google BigQueryは何がすごいのか?

 2019.10.07  ラクまるブログ編集部

ビッグデータ分析サービスとして知られる「Google BigQuery(グーグル・ビッグクエリ)」。使ってみたいなとは思っていても、「ビッグデータ解析ができるなんて高そう…」「扱いが難しそう…」というイメージを持ち、利用を躊躇していないでしょうか?

とっつきにくいというイメージを持たれがちですが、実は Google BigQuery はシンプルで簡単に扱えるビッグデータ解析サービスなのです。


本稿では、そんな Google BigQuery の特長についてご紹介します。

Google BigQueryとは?

改めて、Google BigQuery とは Google Cloud Platform(GCP) で提供されるビッグデータプロダクトの一つです。2012年の Google I/O(年次で開発された開発者向けカンファレンス)にて公式サービスとしてリリースされています。もともとは Google 社内で利用していた「Dremel(ドレメル)」という大規模なクエリを実行するサービスを、外部ユーザー向けに利用できるようにしたサービスが Google BigQuery となります。

Google BigQuery の特徴はなんといっても「超」が何個もつくほど高速な処理です。120憶行の正規表現マッチ付き集計を数十秒で完了します。

なぜ、 Google BigQuery のデータ処理はここまで高速なのでしょうか?

Google BigQueryのデータ処理が高速な2つの理由

Google BigQuery のデータ処理が高速なのは、もちろん何千という数のサーバー群でクエリを並列処理しているからです。そしてその並列処理を実現できる理由が、Google BigQuery の2つの仕組みにあります。

G Suiteで実現するこれからの時代のコミュニーケション

カラム型データストア

一般的なRDBMS(Relational Database Management System)では通常行単位にデータを保存します。これに対して、Google BigQuery は列ごとにまとめてデータの保存を行います。それによりGoogle BigQuery はトラフィックの最小化と高い圧縮率を可能にし、このデータ保存形式がクエリ実行時の高速データ処理を実現しています。

高速な参照用データベースとして利用されカラムナ型とも言われる列指向データベース管理システムを採用しています。

ツリーアーキテクチャ

Google BigQuery はツリーアーキテクチャによって分散処理を行っています。ツリーアーキテクチャとは、クライアントからクエリを受け取るルートサーバーから、実際にクエリ処理を実行する多数のリーフサーバーに対して、クエリがツリー構造で広がっていくものです。これにより、大規模分散処理を実現しています。

 以上2つの仕組みが、Google BigQuery のデータ処理を高速にしている理由です。詳細に関しては、Google が公開しているGoogle BigQuery の「公式ドキュメント」に記載されています。

[RELATED_POSTS]

Google BigQuery の料金はいくら?

Google BigQuery を利用したいけれど躊躇しているというユーザーの多くが、「料金が高そう…」というイメージを持たれているかと思います。この不安を解消するためにも、まずGoogle BigQuery の料金についてご紹介します。さっそく、料金表をご覧ください。

※米国(マルチリージョン)の料金を掲載しております。

課金対象

料金

詳細

アクティブストレージ

$0.02 / GB

毎月10GBまで無料。

長期保存

$0.01 / GB

毎月10 GBまで無料

BigQuery Storage API

$1.10 / TB

BigQuery Storage APIは無料枠に含まれません。

ストリーミング挿入

$0.01 / 200MB

挿入に成功した行が対象課金となります。
最小サイズ1KBで各行が計算されます。

クエリ(オンデマンド)

$5.00 / TB

毎月1TBまで無料。

クエリ(月定額)

$10,000 / 500 slots

追加スロットは500スロット単位で購入できます。

クエリ(年定額)

$8,500 / 500 slots

追加スロットは500スロット単位で購入できます。

ここで着目すべきなのは、Google BigQuery は上記の項目だけを課金対象として、それ以外の操作については課金が発生しないことです。たとえば、ストリーミングインサートではないバッチ処理的なデータのインポート・エクスポートは無料になります。

また、データを1TB保存したとしても月額は$20.00(約2,200円)、50TBのデータをクエリで処理したとしても月額は$50.00(約5,500円)です。しかも、Google BigQuery では毎月最初の1TBのクエリ処理は無料になります。このように、Google BigQuery は想像していた以上に低価格なビッグデータ分析サービスなのです。

まとめ

いかがでしょうか?すでに登録ずみのGoogleアカウント(お持ちでない方はその場で新規アカウント作成すればOKです)から、Google Cloud Platform にログインすることができます。BigQuery はナビゲーションメニューをスクロールして「ビッグデータ」に分類されています。プロジェクトを作成して、データを取り込めばすぐに利用することができます。ぜひ実際に試してみてください。

また、電算システムでは、GCP導入支援サービスとして「GCPアドバイザリーサービス」、「GCP設定代行サービス」、「セキュリティ診断サービス」をご用意しています。いきなり利用してみることに不安があったり、もっと効果的にGCPを活用したいとお考えの方は、ぜひお気軽にご相談ください。

GCP総合ブローシャー

GCP総合ブローシャー
データ・ドリブン時代の歩き方

RELATED POST関連記事


RECENT POST「Google Cloud Platform」の最新記事


Google BigQueryは何がすごいのか?
よくわかるGSuite無料セミナー