<img height="1" width="1" style="display:none" src="https://www.facebook.com/tr?id=445779107733115&amp;ev=PageView&amp;noscript=1">

初心者でもわかるBigQuery入門|
導入方法や使い方を徹底解説!

 2024.04.09  株式会社電算システム

BigQuery(ビッグクエリ)とは、Google Cloud上で稼働するクラウド型DWH(データウェアハウス)です。データの格納だけでなく、クエリを駆使した高速なデータ処理が可能なので、ビッグデータ解析やリアルタイム分析に活用できます。

ユーザーインターフェースがシンプルで扱いやすいBigQueryではあるものの、利用するにはSQL言語やデータベース構築に関するある程度の知識が必要です。

そこで本記事では、初心者の方でも簡単に理解できるよう、BigQueryの入門ガイドをまとめました。ツールの導入方法や初期設定方法、クエリの実行方法などを解説していますので、ぜひ参考にしてください。

an-introduction-to-bigquery-that-even-beginners-can-understand

BigQuery入門その1. 導入方法

BigQueryを利用するためには、Google Cloudに登録しなければなりません。ただし、2024年1月時点で$300分のクレジットが用意されているため、まずは試用感覚でツールを導入するのも方法の一つです。

ツールを導入する際は、次のような流れで手続きを進めましょう。

  1. Google Cloudへの登録
  2. BigQueryの管理画面にアクセス

1. Google Cloudへの登録

Googleの公式サイトからBigQueryの専用ページにアクセスします。[BigQueryの無料トライアル]をクリックし、登録手続きを行いましょう。

an-introduction-to-bigquery-that-even-beginners-can-understand01

Google Cloudのアカウントを作成するため、必要な情報を登録します。

an-introduction-to-bigquery-that-even-beginners-can-understand02

企業名やクレジットカードの情報を入力します。

an-introduction-to-bigquery-that-even-beginners-can-understand03

2. BigQueryの管理画面にアクセス

Google Cloudへの登録が済むと、管理コンソールに自動で遷移します。

画面の左側にメニューがあるため、そのなかから[BigQuery]をクリックします。

an-introduction-to-bigquery-that-even-beginners-can-understand04

すると、BigQuery Studioと呼ばれる管理画面に移行します。

an-introduction-to-bigquery-that-even-beginners-can-understand05

BigQuery入門その2. 初期設定方法

BigQueryが利用できる状態になれば、先に初期設定を済ませておくのがおすすめです。必須ではありませんが、設定するとツールの利便性が高まります。

  1. ショートカットの設定
  2. データ利用制限の設定

ここでは、上記の流れで初期設定の方法を紹介します。

1. ショートカットの設定

Google Cloudの管理コンソールからBigQueryにアクセスするには、ナビゲーションを大幅にスクロールしなければなりません。また、ナビゲーションには数多くのプロダクトが表示されているため、[BigQuery]の項目を探すのは困難です。

an-introduction-to-bigquery-that-even-beginners-can-understand06

そこで、[BigQuery]の隣にあるピンのアイコンにチェックを入れましょう。

an-introduction-to-bigquery-that-even-beginners-can-understand07

これでナビゲーション上部の[固定されたプロダクト]内に、ピンが付いたプロダクトが表示されるようになります。また、普段使用しないプロダクトのピンを外すのも良いでしょう。

an-introduction-to-bigquery-that-even-beginners-can-understand08

すると、画面上部が整理され、よりスムーズにBigQueryへとアクセスが可能です。

an-introduction-to-bigquery-that-even-beginners-can-understand09

2. データ利用制限の設定

BigQueryでは従量課金制が採用されていますが、初期状態では利用量に制限が設けられていません。そのため、想定以上にデータを利用し、高額な請求が発生する可能性があります。

このような事態を避けるためにも、データの利用制限を設定しましょう。

Google Cloudの管理コンソールから、[IAMと管理]をクリックします。

an-introduction-to-bigquery-that-even-beginners-can-understand10

左側のメニューから[割り当てとシステム上限]を選択します。

an-introduction-to-bigquery-that-even-beginners-can-understand11

フィルタの隣にあるスペースに「BigQuery」と「Query usage」と入力し、検索対象を絞り込みましょう。

an-introduction-to-bigquery-that-even-beginners-can-understand12

名称[Query usage per day」項目にチェックを入れ、画面右上の[割り当てを編集]をクリックします。

an-introduction-to-bigquery-that-even-beginners-can-understand13

[Unlimited]のチェックを外し、[新しい値]の項目に数値を入力します。ここでは、1日あたりのデータの利用上限を入力しましょう。

an-introduction-to-bigquery-that-even-beginners-can-understand14

名称[Query usage per day per user]も同じように設定を行います。データの利用上限は、自社の予算に合わせて任意で設定してください。これで上限を超えて費用が発生する心配はありません。

BigQuery入門その3. 階層構造に対する理解

BigQueryではSQLを駆使してクエリを実行します。よりスムーズにクエリを実行するには、データベースの階層構造を理解することが重要です。

データベースの階層は以下の通り、「プロジェクト」が最も上層に位置し、そのなかに中層の「データセット」、さらに下層の「テーブル」と分かれています。

an-introduction-to-bigquery-that-even-beginners-can-understand15

  • プロジェクト:最も上層に位置する要素で、課金時の基準単位
  • データセット:テーブルへのアクセスを制御するためのコンテナ
  • テーブル:行形式で個別のレコードが整理されたもの

そのため、クエリを実行する前にまずは、大枠となるプロジェクトを作成し、そこへ個別のデータセットやテーブルを格納します。

このデータベース階層構造を理解しておくことで、各データを綺麗に整理できるため、よりスムーズなクエリの実行が可能です。

BigQuery入門その4. クエリの実行方法

BigQueryを利用してクエリを実行するには、次のような手順で作業を行います。

  1. プロジェクト作成
  2. データセット作成
  3. テーブル作成
  4. SQL構文の書き込み

ここでは、各手順における具体的な操作方法を紹介します。

1. プロジェクト作成

BigQuery Studioにアクセスし、画面上部のプロジェクト名をクリックします。

an-introduction-to-bigquery-that-even-beginners-can-understand16

[新しいプロジェクト]をクリックしましょう。

an-introduction-to-bigquery-that-even-beginners-can-understand17

プロジェクト名と利用する組織を設定してください。

an-introduction-to-bigquery-that-even-beginners-can-understand18

画面下部の[作成]をクリックすると作業は完了です。その後は、作成したプロジェクト名のBigQuery Studioに自動で切り替わります。

2. データセット作成

作成したプロジェクトのなかにデータセットを格納しましょう。

エクスプローラの枠内には、作成済みのプロジェクトIDが記載されています。このIDの右側にある三点リーダーをクリックし、[データセットを作成]をクリックします。

an-introduction-to-bigquery-that-even-beginners-can-understand19

データセットIDやロケーションなどの項目を設定しましょう。

an-introduction-to-bigquery-that-even-beginners-can-understand20

  • データセットID:
    英数字とアンダースコアを組み合わせた任意のIDを設定。
  • ロケーションタイプ:
    データを保存する際のリージョンを選択。
  • デフォルトのテーブルの有効期限:
    チェックを入れると期限切れのデータが自動的に削除される。

データセットが生成されると、エクスプローラ内のプロジェクトIDの下位にデータセットIDが表示されます。

an-introduction-to-bigquery-that-even-beginners-can-understand21

3. テーブル作成

テーブルを作成するには、まずデータセットIDをクリックします。すると、画面の右側に詳細が表示されるので、画面右上にある[テーブルを作成]をクリックしてください。

an-introduction-to-bigquery-that-even-beginners-can-understand22

最上部のソースの項目で、アップロード元となるプラットフォームを選択します。BigQueryでは、GoogleドライブやGoogle Cloud Storage、ローカルなどからデータをアップロードできます。例えば、Googleスプレッドシートの表を移行したい場合は、[Googleドライブ]を選択してファイルを指定しましょう。

an-introduction-to-bigquery-that-even-beginners-can-understand23

そのほかの項目は次のように設定します。

an-introduction-to-bigquery-that-even-beginners-can-understand24

  • 送信先:
    プロジェクト・データセットIDはデフォルトの状態。宛先となるテーブルが記載されていない場合は、対象となるテーブル名を入力する。
  • スキーマ:
    「自動検出」にチェックを入れると、フィールドが自動的に生成される。
  • タグ:
    任意のタグを設定できる。情報が整理されるため、カテゴリー分けや検索をする際に役立つ。

最後に[テーブルを作成]をクリックすると作業は完了です。

4. SQL構文の書き込み

作成したテーブルを選択し、詳細画面から[クエリ]をクリックすると、クエリエディタに移行します。

an-introduction-to-bigquery-that-even-beginners-can-understand25

クエリエディタには、SQL言語で命令文を記載しましょう。記述後、[実行]をクリックするとクエリが実行され、その結果が画面下部に表示されます。

an-introduction-to-bigquery-that-even-beginners-can-understand26

BigQuery入門その5. 外部システムとの連携

BigQueryは、外部システムと連携することでツールの利便性を高められます。ここでは、GoogleスプレッドシートとGoogle Analytics 4の連携方法を解説します。

Googleスプレッドシートとの連携

Googleスプレッドシートで作成したテーブルをBigQueryに取り込めます。Googleスプレッドシートは表作成機能が豊富なので、効率性の高い方法でテーブルを作成してからデータを移行できるのがメリットです。Googleスプレッドシートのデータを取り込むには、BigQueryのテーブルを作成する際に、[Googleドライブ]を指定して目的のファイルを指定します。

また、クエリの実行後、[クエリ結果]内の[データを探索]をクリックすると、Googleスプレッドシートに実行結果を出力できます。Googleスプレッドシート上で分析データを可視化できるのが特徴です。

an-introduction-to-bigquery-that-even-beginners-can-understand27

Google Analytics 4との連携

Google Analytics 4(GA4)は、Webサイト用のアクセス解析ツールです。

BigQueryと連携すると、Google Analytics 4で計測したアクセス数やコンバージョン数といったユーザーの行動データを、BigQuery上に保存できます。Google Analytics 4で取得するのが難しい生データを、BigQueryを使って分析できるのが利点です。

Google Analytics 4との連携手順は次の通りです。

  1. Google Cloudの管理コンソールから[APIとサービス]にアクセス
  2. ナビゲーションメニュー[ビッグデータ]を選択し、[BigQuery API]をクリック
  3. BigQuery APIを有効にする
  4. GA4の管理ページにアクセスし、[プロパティ > BigQueryのリンク]にアクセス
  5. 新規リンクを作成し、連携するBigQueryのプロジェクトを選ぶ
  6. 作成したリンクを送信することでBigQueryへとデータが送られる

BigQueryの使い方を理解したうえでツールの定着化を図ろう

ツールの導入前にBigQueryの使い方をしっかりと理解しておけば、運用中の不明点が少なくなり、ユーザーが不満を抱えるリスクを抑制できます。結果としてBigQueryのスムーズな定着が図れるでしょう。

電算システムでは、Google Cloudの導入支援サービスを提供しています。テクニカルな疑問にも答えられる技術コンサルティングや、体系的な基礎知識をアドバイスするスターターパックなどを用意しています。BigQueryに関してわからない点があれば、気軽にご相談ください。電算システム経由でGoogle Cloudに契約すると、基本利用料が3%割引きになります。

また、以下のページでは、3大クラウドサービスとして知られるAWS、Azure、Google Cloudを比較した資料を提供しています。無料でダウンロードできるので、クラウドサービスの導入を検討中の方は以下の資料もぜひ参考にしてください。

AWS・Azure・GCP(Google Cloud) 3大クラウドサービスをわかりやすく比較

RELATED POST関連記事


RECENT POST「Google Cloud(GCP)」の最新記事


Google Cloud(GCP)

BigQuery BI Engineとは?利用料金や設定方法を解説!

Google Cloud(GCP)

BigQuery Omniとは?AWS・Azureとの接続方法や導入メリットを解説

Google Cloud(GCP)

Google BigQuery を使ってみよう!

Google Cloud(GCP)

Google BigQuery の料金体系を解説

初心者でもわかるBigQuery入門|導入方法や使い方を徹底解説!