近年AIや機械学習という単語が流行の兆しを見せ、機械学習を活用したいが専門知識を持っているエンジニアがいない、何から始めて良いか分からない、といったようなお悩みをお持ちの企業様も多いのではないでしょうか。そのような皆様にはぜひ、BigQuery ML™を利用することをおすすめします。BigQuery MLは、データウェアハウス上でSQLを使って機械学習が簡単に実行できるサービスです。この記事では、BigQuery MLの特徴や、具体的な使い方について解説します。
BigQuery MLとは
BigQuery MLはGoogleが提供している、専門知識がなくても機械学習を実行できるサービスです。BigQuery MLを利用するためには、同じくGoogleが運営するクラウドデータウェアハウス、BigQuery を利用する必要があります。BigQueryはデータ分析を高速で行えることが特徴のデータウェアハウスで、BigQuery上で加工・前処理したデータをそのまま分析できるサービスが、BigQuery MLです。
BigQuery MLの特徴は、データベース言語であるSQLだけで複雑な機械学習の工程を実行できる点にあります。普段データベースを操作するときと同じ感覚で機械学習ができるため、BigQuery MLは教育のためのコスト削減や業務の効率化につなげることが可能です。
BigQuery MLでクエリを実行するには料金がかかります。料金体系は以下の2種類です。
- オンデマンド料金
- 定額料金
オンデマンド料金では、各クエリに処理されたデータのバイト数に応じて課金されます。データ1TBにつき$5.00です。
定額料金では、クエリを実行するために使う仮想CPU(スロット)を購入します。スロットを購入することでクエリ実行のための処理容量を得られ、料金は以下の通りです。
- 月契約:100スロットにつき1月あたり$2000
- 年契約:100スロットにつき1月あたり$1700
なお、BigQuery には月々の無償利用枠が存在し、クエリに処理されるデータが1TB /月までは無料となっています。
BigQuery MLで実行できる機械学習
BigQuery MLではさまざまな機械学習を実行することができます。BigQuery MLでサポートされている主な機械学習の手法とモデルは、以下の通りです。
- 回帰:ロジスティック回帰、線形回帰、DNNなど
- 分類:2項分類、他項分類、DNNなど
- クラスタリング:K平均法クラスタリング
- 推奨事項(レコメンデーション):行列分解
- 時系列予測:ARIMAモデル
主なモデルの特徴と活用例を紹介します。
- 線形回帰:未来を正確に予測する際に用いられる。売上予測などに活用
- 2項分類:データを2種類のグループに分類する。ECサイト購入者の会員・非会員分類などに活用
- K平均法クラスタリング:データを特徴ごとのグループに分類する。年代別の顧客分類などに活用
- 行列分解:行列を用いて推奨事項を導き出す。商品のレコメンデーションなどに活用
- ARIMAモデル(時系列予測):時系列に沿って数値を予測する。毎日の売上数の予測などに活用
BigQuery MLではこれまで機械学習モデルを随時追加してきた実績があります。そのため、将来的にはこれら以外のモデルのサポートも始まるかもしれません。
また、これ以外のモデルを今すぐ使いたい場合は、TensorFlowモデルを外部からインポートすることも可能です。
BigQuery MLのメリット
BigQuery MLには大きなメリットが2つあります。
- 専門知識が不要
- コストパフォーマンスが高い
この2つのメリットによって、BigQuery MLは初心者でも始めやすい機械学習サービスです。
これら2つのメリットについて、詳しく解説していきます。
専門知識が不要
BigQuery MLのメリットの1つは、機械学習に関する専門知識なしで、誰でも簡単に機械学習が実行できるという点にあります。機械学習には通常、目的の分析手法にに適したプログラミング言語の知識が欠かせません。そのため新たに学習するコストや外注コストがかかってしまい、自社で持っているデータを上手く活用できない場合があります。
BigQuery MLで機械学習を実行するためには、SQLを用います。SQLはデータベースを操作するための言語ですが、BigQuery上であればSQLのみで機械学習を実行可能です。機械学習を実行するためには、通常のSQL文に、機械学習モデルを作成するための特殊なSQL文を数行追加するだけです。SQLの基礎知識さえあれば誰でも実行できるので、専門家がいなくてもデータを活用できます。
抜群のコストパフォーマンス
BigQuery MLのもう1つのメリットとして、コストパフォーマンスの高さが挙げられます。BigQuery MLは、基本的に機械学習したデータの分だけ料金がかかる従量課金制です。BigQueryのストレージ料金自体も安価であるため、他のクラウドデータウェアハウスよりも費用を安く抑えられるでしょう。
従量課金制のよい点は、利用頻度に合わせて費用を調整できるということです。普段はBigQueryをストレージとして活用し、機械学習でデータ分析を行いたい場合にのみ、利用料を払えばよいでしょう。膨大な量のデータを活用して定期的に機械学習をする場合には、定額料金でのプランもあります。データの活用状況に応じて柔軟に費用を調整できることが、抜群のコストパフォーマンスにつながっているのです。
BigQuery MLの使い方
BigQuery MLで機械学習を行うには、次の作業を行う必要があります。
- 学習モデルの作成とトレーニング
- 学習モデルの評価
- 予測の実行
BigQuery MLでモデルを作成するために、まずはデータセットを用意します。その上で、モデルを作成するために以下のステートメントを設定しましょう。
- CREATE MODEL:モデルの名前を設定する
- OPTIONS:使用するモデルのタイプや列名、パラメータなどを設定する
OPTIONSのMODEL_TYPEで、使用するモデルを指定します。
- LINER_REG:線形回帰
- LOGISTIC_REG:ロジスティック回帰
- KMEANS:K平均法クラスタリング etc...
CREATE MODELとOPTIONSを設定した上で、通常のSQL文を書き、トレーニングを行います。トレーニングを済ませたら、モデルの状態を評価しましょう。BigQuery MLには評価関数が用意されており、それを使用することで評価ができます。トレーニングと評価を繰り返してモデルを構築できたら、実際に予測を行いましょう。BigQuery MLに用意されている予測関数を用いて、予測を実行させます。
BigQuery MLで機械学習による予測を実行することで、顧客の購買行動予測や需要予測、売上予測など、マーケティングに役立つさまざまなデータを入手することが可能です。BigQuery MLを使って、ぜひ自社のデータを最大限活用してください。
DSKが提供するデータ分析サービス
BigQuery MLでデータ分析をしたいけれど、時間が割けないなどの理由で諦めてしまってはいませんか? データ分析をするなら、弊社DSKにお任せください。弊社ではコンサルティングからデータの収集・加工、データ分析、システム化まで、データ分析に関するあらゆるサービスを一貫してご提案致しております。データインテグレーターとしての弊社の強みは、以下の3つです。
- データエンジニア:ビジネス課題の解決のためにデータを活用可能な状態にします
- データサイエンティスト:数学・統計学に基づいたソリューションを提案します
- 開発エンジニア:データ分析基盤や個別のシステム開発に対応します
弊社のデータ分析では課題の設定と計画から結論まで、全てのプロセスに対応可能です。全体のサイクルだけでなく、各プロセスのサイクルを回しながら、お客様のビジネス課題の解決に貢献致します。また、弊社ではワークショップやコンサルティング、トレーニングなど、データ分析以外にもさまざまなサービスをご提供することが可能です。「データはあるけれど上手く活用できない」とお悩みの企業様は、ぜひ弊社DSKのサービスをご利用ください。
まとめ
BigQuery MLは専門知識なしで機械学習ができる画期的なサービスです。基礎的なSQLの知識さえあれば、マーケティングに役立つデータ分析が誰でも簡単にできます。ぜひBigQuery MLを活用して、ビジネス課題の解決にお役立てください。
- カテゴリ:
- Google Cloud(GCP)
- キーワード:
- bigquery ml