Google Cloudに搭載されているデータウェアハウス「BigQuery」を利用するには、SQLやPythonといったプログラミングコードの知識や技術が求められます。そのため、プログラミングに詳しくない人にとっては、「BigQueryは扱いにくい」という印象を持っていることもあるでしょう。
しかし、Gemini in BigQueryを利用すれば、自然言語のプロンプトを入力するだけで、AIが目的に沿ったSQLコードやPythonコードを生成してくれます。出力されたコードをそのまま添付するだけでクエリを実行できるのが魅力です。
本記事では、Gemini in BigQueryの特徴や仕組み、使い方、料金体系などを詳しく解説します。
Gemini in BigQueryとはBigQuery内で生成AIを利用できる機能
Gemini in BigQueryを活用するには、まずBigQueryやGeminiの仕組みをよく理解しておく必要があります。ここでは、それぞれのツールの概要やGemini in BigQueryの特徴・強みを解説します。
BigQueryの概要
BigQueryとは、Google Cloudに搭載されているサービスの一つで、サーバーレスでスケーラビリティに優れたデータウェアハウス(DWH)です。クラウド上でクエリの実行や検索、BI(ビジネスインテリジェンス)といった機能を利用できるため、ITインフラを導入したり管理したりする必要がありません。
クエリを実行する際は、SQLやPythonといった主要な言語を使用できるのも特徴です。また、ペタバイト級のデータに対しても高速なクエリを実行でき、さらにWeb広告やアプリイベントといった変動しやすいデータでもリアルタイムで分析が可能です。
Geminiの概要
Geminiは、Google社が開発した高性能かつ柔軟な生成AIモデルです。マルチモーダルな仕様が特徴で、テキストやプログラミングコード、画像、動画、音声といった多様な情報を統合的に扱えます。そのため、資料生成や文章の要約・翻訳、音声データの文字起こし、動画コンテンツの生成など、さまざまな業務を短時間で処理できます。
Geminiアプリを用いて単独で利用できるほか、Google社が提供するさまざまなサービスと組み合わせて活用できるのもポイントです。例えば、グループウェアのGoogle Workspaceに登録すると、GmailやGoogleドライブなどの画面上にGeminiサイドパネルが現れ、編集画面や管理画面を見ながらAIに指示を与えられます。
Gemini in BigQueryの概要
Gemini in BigQueryは、独立した製品ではなく、BigQueryのインターフェース(BigQuery Studio)内に直接組み込まれた、AIによる一連の支援機能群を指します。これにより、ユーザーは使い慣れたBigQueryの環境を離れることなく、シームレスにAIのサポートを受けられます。
BigQueryとGeminiの統合は、データ分析のライフサイクル全体を網羅するように設計されているのが特徴です。SQL・Pythonのコーディング支援やGUI上でデータの変換や可視化を行えるデータキャンバス、分析対象のデータを素早く検索できるデータディスカバリーなど、豊富なAI機能を使って従来の作業を簡略化できます。
Gemini in BigQueryでできること
Gemini in BigQueryを利用すると、主に次のようなことが可能になります。
- データクレンジング
- SQLやPythonのコーディング支援
- クエリの解説
- クエリパフォーマンスの解析
- データインサイトによる分析起点の創出
- データキャンバスによる分析ワークフローの構築
各機能の特徴や具体的な活用例を紹介します。
データクレンジング
BigQuery Studioには、コーディング作業を最小限に抑え、視覚的な操作でデータクレンジングや変換を行える「データの準備」と呼ばれるツールが搭載されています。このツール内でGemini in BigQueryを利用することで、簡易的な指示だけで効率良くデータクレンジングを実行できます。高度な自然言語処理技術が備わったGeminiを活用すれば、質の高いデータクレンジングが可能です。
例えば、「株式会社A&B」と「(株)A and B」のように、完全には一致しないものの、意味的には同じエンティティを指す可能性が高いレコードをAIが識別し、重複を排除します。ほかにも、住所データの「St.」と「Street」の混在や、電話番号のフォーマットの不統一などを、AIが文脈を理解して標準的な形式に統一できるのも特徴です。
データ分析を行う前にこのようなデータクレンジングを実行することで、分析精度の向上につながります。
SQLやPythonのコーディング支援
データアナリストの日常業務において、多くの時間がプログラミングコードの記述やデバッグなどに費やされます。Gemini in BigQueryを導入すれば、このようなプロセスを効率化する強力なコーディング支援機能を利用できます。
SQLの構文を正確に覚えていなかったり、新しいデータセットの構造を完全に把握していなかったりする場合でも、平易な日本語や英語で指示を与えるだけで、Geminiが複雑なSQLクエリやPythonスクリプトを自動で生成します。不完全なクエリやエラーを含むクエリに対しても、Geminiが的確な修正案を提示してくれます。
コーディング支援機能は、特に分析の初期段階における「コールドスタート問題(何から手を付けて良いかわからない状態)」を解決するのに非常に有効です。また、SQLに不慣れな従業員でもデータにアクセスしやすくなるほか、熟練したデータアナリストも定型的なクエリ作成の手間を省き、より本質的な分析に集中できます。
クエリの解説
ほかのユーザーが記述した複雑なSQLクエリや、過去に自身が作成したものの内容を忘れてしまったクエリを理解するのは、骨の折れる作業です。Gemini in BigQueryには、選択したSQLクエリの意味や役割などを自然言語でわかりやすく解説する機能が搭載されています。
この機能を使えば、長いサブクエリや難解なウィンドウ関数を含むクエリであっても、「このクエリでは、地域ごとにデータをグループ化し、平均売上を計算しています」といった平易な説明を得られます。このような仕組みを活用すれば、チーム内でのクエリに対するレビューや新人データアナリストの教育、レガシーコードの保守などに効果を発揮します。
クエリパフォーマンスの解析
Gemini in BigQueryでは、コーディングや分析作業のサポートだけでなく、BigQuery自体の運用効率を高めるためのヒントや示唆を得ることも可能です。
例えば、クエリの実行パターンやテーブルのデータ分布をAIが分析し、クエリパフォーマンスの向上とコスト削減につながる最適なパーティショニングキーやクラスタリングキーを提案してくれます。この提案に沿ってテーブル設計を最適化することで、クエリがスキャンするデータ量を減らし、レスポンスタイムの短縮と利用料金の節約を同時に実現できます。
そのほか、BigQuery上で実行されるApache Sparkのワークロードに対しても、チューニングの改善方法や、ジョブが失敗した際のトラブルシューティングなどに関するアドバイスを得られます。複雑な操作は必要なく、自然言語でのプロンプトを入力するだけで済むため、初心者の方にとっても安心です。
データインサイトによる分析起点の創出
新しいデータセットを前にしたとき、「どこから分析を始めれば良いか」と途方に暮れることがあります。このような場合でも、Gemini in BigQueryのデータインサイト機能を利用すれば、テーブルのメタデータ(カラム名やデータタイプ、概要など)を自動で分析し、そのデータセットに特化した分析の切り口となるような質問と、すぐに実行可能なクエリのリストが生成されます。
例えば、顧客の解約データが含まれるテーブルを分析する際は、「特定の顧客セグメントにおける解約の主な要因は何か」といった、価値ある分析につながる問いを自動で提案してくれます。提案された質問をクリックするだけで対応するクエリが実行されるため、短時間で効率良く分析の起点を生み出せるのがポイントです。
データキャンバスによる分析ワークフローの構築
データキャンバスは、データ分析のプロセス全体を自然言語とグラフィカルなインターフェースで構築できる機能です。まるでホワイトボードに図を描くように、データの発見から結合、クエリの実行、結果の可視化まで、一連のフローを直感的に組み立てられます。
例えば、「POSシステムの売上データとCRMツールの顧客情報を結合し、店舗・製品カテゴリごとの収益を分析して結果をグラフで表示する」といった自然言語のプロンプトを起点に、分析パイプラインを視覚的に構築できます。
そのため、分析プロセスそのものをチームで共有・再利用する際に便利です。また、仮説を立てながら試行錯誤を繰り返す探索的データ分析(EDA)としても活用できます。
Gemini in BigQueryを利用する前に必要な準備
Gemini in BigQueryを利用するためには、あらかじめGemini for Google Cloud APIを有効にする必要があります。
Google Cloudの管理コンソールにアクセスし、画面上部の検索窓に「BigQuery」と入力します。検索項目に出てくる[BigQuery]をクリックし、BigQuery Studioの画面にアクセスします。

BigQuery Studioのトップページに表示されている[SQLクエリ]をクリックします。

クエリの編集画面が表示されるので、画面右上の鉛筆アイコンにカーソルを合わせます。以下のように、「Gemini in BigQueryが無効になっています」の表示が現れるので、[続行]をクリックします。

[Gemini for Google Cloud API]の項目にある[有効にする]をクリックします。

これでGemini for Google Cloud APIが有効化され、Gemini in BigQueryの機能をいつでも利用できるようになります。
Gemini in BigQueryの使い方
Gemini in BigQueryを利用すると、SQLクエリや分析方法などをノーコードかつスピーディーに出力できますが、そのためには利用方法や具体的なプロンプトの入力方法を理解する必要があります。そこで、ここではGemini in BigQueryの具体的な使い方を解説します。
Geminiを使ったSQLクエリの生成
Geminiを利用すれば、自然言語のプロンプトを入力するだけで、知識がなくてもSQLクエリを自動生成できます。そのためには、まずBigQuery Studioから[SQLクエリ]をクリックし、クエリの編集画面を表示します。そして、画面左上にある鉛筆アイコンをクリックすると、プロンプトの入力画面が開きます。

例えば、ECサイトのデータセットを用いて、特定の条件にもとづいた月次売上レポートを作成する場合、次のようなプロンプトを入力します。分析対象のテーブル名や抽出条件、集計方法、並び替え順序など、できるだけ具体的な指示を与えることが重要です。
【プロンプトの入力例】
| /* public-data.thelook_ecommerce.orders テーブルを使用して、ステータスが'Shipped'の注文について、月別の注文件数と総売上高(sale_priceの合計)を計算してください。結果は年月で降順に並べてください。 */ |
すると、次のようなSQLクエリが完成します。
【出力結果の例】
| SELECT FORMAT_TIMESTAMP('%Y-%m', created_at) AS order_month, COUNT(order_id) AS number_of_orders, SUM(sale_price) AS total_sales FROM `bigquery-public-data.thelook_ecommerce.orders` WHERE status = 'Shipped' GROUP BY order_month ORDER BY order_month DESC; |
その後は、出力結果画面にある[挿入]をクリックすると、SQLクエリが編集画面へ即座に反映される仕組みです。
ノートブックでのPythonコード生成
BigQuery Studioのノートブック機能を利用すれば、Pythonコードを用いて環境構築の手間なくデータ分析を行えます。Gemini in BigQueryを利用することで、データの分析や可視化に必要なPythonコードを自動生成できます。
BigQuery Studioから[ノートブック]をクリックすると、ノートブックの編集画面に移行します。そして、コードを入力できる状態で、画面右側のGeminiアイコンをクリックし、[コードを生成する]を選択します。

続いて、プロンプトを使ってGeminiに指示を与えましょう。例えば、公開データセットを用いて特定の分析を行い、その結果をPythonのデータ分析ライブラリであるpandasでさらに処理を加える場合、次のようなプロンプトを入力します。
【プロンプトの入力例】
| Generate Python code to query the 'bigquery-public-data.austin_bikeshare.bikeshare_trips' table, calculate the average trip duration in minutes for each starting station, and display the top 10 stations with the longest average trip duration using a pandas DataFrame. |
そして、プロンプト入力欄の左側にある[生成]をクリックすると、以下のように、ライブラリのインポートからクエリの実行、結果のDataFrameへの変換といったプロセスを実行可能なPythonコードが生成されます。

【出力結果の例】
| Python from google.cloud import bigquery import pandas as pd client = bigquery.Client() query = """ SELECT start_station_name, AVG(duration_minutes) AS average_duration FROM `bigquery-public-data.austin_bikeshare.bikeshare_trips` WHERE start_station_name IS NOT NULL GROUP BY start_station_name ORDER BY average_duration DESC LIMIT 10 """ query_job = client.query(query) df = query_job.to_dataframe() print("Top 10 stations with the longest average trip duration:") print(df) |
Gemini in BigQueryの料金体系
Gemini in BigQueryは、原則として無料で利用できます。ただし、StandardやEnterpriseといったエディションごとに使用可能な機能(SQLコード生成やメタデータ生成など)が異なります。詳細は公式サイトの「Gemini for Google Cloud pricing」のページから確認できます。
なお、BigQueryそのものには従量課金での料金が発生するため、注意が必要です。BigQueryの料金には、アクティブストレージの利用料やクエリを実行する際の料金などが加算されます。詳細な料金体系については、こちらの記事で詳しく解説しています。
Gemini in BigQueryを活用してクエリ生成や分析業務を効率化しよう
Google CloudにGeminiの機能が搭載されたことで、アプリケーション開発やデータ分析、トラブルなど、さまざまな形で生成AI技術を活用できます。なかでもGemini in BigQueryでは、プロンプトを入力するだけで、AIがSQL・Pythonコードの作成や分析起点の創出などをサポートしてくれます。
SQLやPythonといったプログラミングの知識が少ない場合でも、自然言語で指示を与えるだけで独自のコードを生成できるのが利点です。また、Gemini機能を利用するために追加費用がかからないため、気軽に活用できるのもポイントだといえるでしょう。
電算システムでは、Google Cloudのスターターパックサービスや技術コンサルティングサービスなどを提供しています。Google Cloudを活用したデータ分析基盤の構築方法や、データの活用方法などに関して、プロの観点からアドバイスを行っています。「Google Cloudを活用したいが具体的なイメージが湧かない」といったお悩みを抱える方は、ぜひ電算システムへと気軽にお問い合わせください。
- カテゴリ:
- Google Cloud(GCP)
- キーワード:
- Gemini in BigQuery

