<img height="1" width="1" style="display:none" src="https://www.facebook.com/tr?id=220807558931713&amp;ev=PageView&amp;noscript=1">

BigQuery を使ってデータ分析を始めてみよう

 2020.01.14  ラクまるブログ編集部

BigQuery という言葉は聞いたことあるけど、どんな用途に適しているの?データ分析で使われていることは知っているけど、その理由は?興味はあるけどよく分からないままという方が実は多いのではないでしょうか?
今回は、BigQuery がデータ分析に適している理由についてご紹介致します。本稿をきっかけに BigQuery に少しでもご興味を持って頂けたら幸いです。

BigQuery はデータ分析に適したクラウドサービスです

Google BigQuery は、Googleが提供しているクラウドコンピューティングサービス
(以下、GCP:Google Cloud Platform)のプロダクトの一つです。GCP のプロダクトの中で、特にビッグデータの分析や処理に優れています。

BigQuery は、DWH(データウェアハウス:データの倉庫)とも呼ばれています。MySQL・Oracle・PostgreSQLなどの一般的なRDBMSと似ていますが、 テラバイト・ペタバイト級の大量データを、かなりの速度で処理できる、という特徴があります。「かなり」というのは、例えば「1秒では終わらないけど、数十秒〜数分で終わる」というようなレベルです。用途としては、売上データ・在庫データ・顧客データなど、数年単位のデータをDWHに格納して、必要に応じたデータ分析をする、というのが一般的です。

BigQuery とよく比較されるサービスとして、 Amazon が提供している Amazon Redshift(以下Redshift) や Snowflake が提供しているSnowflake Data Warehouse(以下Snowflake)などが存在しています。これらと比較をしても BigQuery がデータ分析に特に適してます。その理由について説明します。

①利用料金が時間ではなく、処理したデータの量に応じて決まること

RedshiftやSnowflakeでは、利用者がデータの分析や処理のために個別にインスタンス(仮想的なコンピューターのことです)を立ち上げる必要があり、利用する時間に対して課金が発生します。コンピュータリソースを専有できる代わりにお金を払う、というイメージです。
対して BigQuery は、インスタンスの概念がなく、常に Google が起動している数十台のマシンを利用してデータを処理するため、時間ではなく、処理したデータの量に応じて課金が発生します。
前者は例えばBIツールで表示するためのデータの処理など、定期的に決まった処理をし続ける、という用途に向いていますが、データ分析では、その時々で欲しい結果、必要な処理が違ってきます。そのため、データ分析の作業には、BigQuery の料金体制が良くマッチしているのです。

②「使いたい」と思った時にすぐに使えること

例えばRedshiftでは、データを処理するマシンの性能や、保存されるデータの検索方式など、用途に合わせた細やかな設定が可能です。使うたびに設定し直す必要はありません(もちろん、必要に応じてすぐに設定し直すこともできます)が、設定にはエンジニア的な知識が必要になりますし、目的に応じてその都度機能・価格とも最適な設定をしようと思えば、どうしても時間や手間がかかってしまいます。
対して BigQuery には、このようなチューニング機能はありません。シンプルで、難しいことを考える必要はない。チューニングやメンテナンスの手間を省き、使いたいと思った時にすぐ使える。これもまた、BigQuery の強みだと言えるでしょう。

まずはデータを蓄積するところから始めてみよう

さあ、では早速 BigQuery を使って分析しましょう!と言いたいところですがまずはデータを蓄積するところから始めることをオススメします。

G Suiteで実現するこれからの時代のコミュニーケション

データ分析は、課題を解決するための手段です。企業の抱える経営課題を「データエンジニア」、データサイエンティストが適切に汲み取り、課題に対して仮説を立て、データから検証を重ねて、課題解決に向かっていく作業です。

データ分析をする際、目的に応じた必要なデータが最初から用意されているのといないのとでは、分析作業の進行スピードに、大きな差が付いてしまいます。
(当然ですが、データがない場合、1からデータを集める必要があります。)

また、データ分析を進めていくと、思わぬデータが分析の切っ掛けや切り口になることが多々あります。データの数だけアイデアが生まれ、そこからあるいは有用な分析が生まれていくのです。

用途に関わらず、常日頃から多種多様なデータを蓄積することが、現代社会において、経営面で他より一歩先を行くための鍵となります。
(経営者様の意思決定において、データは宝の山となり得ますが、適切に管理されず、有効活用されないまま破棄されていくデータが、世の中には山ほどあります…。)

BigQuery の導入ビフォーアフター

では、BigQuery を導入したらどのような変化が起きるのか。とある企業における、BigQuery の導入前後を見比べてみましょう。以下は、営業部門のAさん、システム部門のBさんの会話です。

before

営業A「今こういう問題があるので、この観点でこんな感じのデータを作ってくれない?」
シスB「今はシステムの整備に手一杯で…。コードを新しく組むので、1ヶ月頂きたいです」
営業A「そんなにかかるの?すぐにデータが欲しいんだけど」
シスB「(そもそもこのデータ本当に必要?何に使うんだろう?)」
営業A「じゃあ、とりあえずお願いね」
シスB「はい、かしこまりました…」
(3週間後)
シスB「はぁはぁ…。やっとできました!お待たせしました」
営業A「うん?なんだっけこれ…。ああ、お願いしてたデータね、ありがとう。どれどれ」
営業A「えーと、これ、1年前のデータと比べるとどうなんだろう…」
シスB「…すみません、そこは分析を頼まれてなかったのでやっていません」
営業A「そうだよね…うーん…」
シスB「………」

after

営業A「今こういう問題があるので、この観点でこんな感じのデータを作ってくれない?」
シスB「はい」ポチポチ「これですね。性別、年齢別に商品ごとの顧客数を1ヶ月分です」
営業A「おー、なるほど!ちなみに1年前と比べるとどうかな?」
シスB「お待ちください」ポチポチ「あぁ、去年とはだいぶ傾向が違いますね」
営業A「やっぱりそうか。このグラフをシートにしてくれれば、新しい企画を考えるよ!」
シスB「分かりました」ポチポチ「どうぞ!」
営業A「ありがとう!」
シスB「いえいえ、頑張ってください!こっちも何か見つけられるか、考えてみます!」

このように、BigQuery の導入効果の本質には、「仮説検証のサイクルが短いこと」が挙げられます。先にも述べたとおり、BigQuery は、「使おう」と思った時にはすぐに使えるツールであること、また結果が返ってくるのも早いことから、BigQuery を用いたデータ分析では、分析の結果をその場ですぐ確認することができます。そのため、分析から連鎖的に新たな「気付き」を得て、より良いアイデアを生み出すことが出来るのです。

BigQuery の大きな効果のもう一つには、営業や現場、システムといった、部門間の垣根を無くすことが出来る、という点があります。例えば営業部門の視点では、今まで見たいデータがあっても、すぐにデータを作ってもらえなかった。一方システム部門の視点では、既に実施している作業に追われて、新しくデータを作るのは難しかった。このような技術的・立場的な差から生まれるすれ違いを、BigQuery が解決し、相乗的な協力体制を生み出せるのです。

 [RELATED_POSTS]

BigQueryを使ってデータ分析を始めてみよう

いかがでしたでしょうか。本稿をお読み頂き、BigQuery の強みや素晴らしさが少しでも伝わりましたでしょうか。BigQuery は、データ分析に強いだけでなく、チーム間の垣根を無くし、より良いチームを作ることも出来ます。Google アカウントさえお持ちであれば、GCP にログインして、すぐにお試し頂けることも魅力の一つです。
(無料トライアルの枠が存在するので、料金面も安心です。)

初めから大々的にデータ分析をしようと思うとなかなか進まないことがあります。なので、まずは身の回りのデータを BigQuery に貯める所から始めてみてはいかがでしょうか。ぜひ、あなたの会社でも BigQuery でデータ分析をして、経営課題解決の糸口を見つけてみませんか。電算システムは企業のデータ分析をサポートします。

初めてのデータ分析

データ・ドリブン時代の歩き方
初めてのデータ分析

RELATED POST関連記事


RECENT POST「データ分析」の最新記事


BigQuery を使ってデータ分析を始めてみよう
【オンライン開催】よくわかるデータ活用セミナー troccoとBigQuery を使って散在するデータを連携させよう