前回のブログでは GWS (略:Google Workspace )にバンドルされた GCS(略:Google Cloud Search )をご紹介しました。
バンドル版の GCS は、GWS 内のアイテムのみを対象として検索が可能ですが、サードパーティのデータを含めることは出来ません。
今回は、GCSスタンドアロン版について解説と、実際に Google が提供しているWebクロールコネクタを利用した実践をご紹介します。
GCS バンドル版、スタンドアロン版を併用することにより GWS 内のデータを無制限に、さらに外部のアプリケーションデータも横断検索することができるようになります。
スタンドアロン版とは
GCS スタンドアロン版では、GWS 内のデータだけではなく、社内にあるファイルサーバやデータベースなどのデータを含めて検索対象とすることができます。さらに、それぞれのサードパーティのアクセス権限をGoogle アカウントと同期することで、アクセス権限に応じたセキュアな検索も可能になります。
GWS のコンテンツは自動的に GCS で検索対象となりますが、サードパーティのコンテンツ・データを検索するには、Google API を使用してデータと Cloud Search を統合する「コネクタ」と呼ばれるソフトウェア プログラムが必要になります。
GCS ではSalesforce、SAP、その他 100 種類以上のさまざまなサードパーティのデータソースに対応するコネクタが用意されており利用することができます。
Google または認定パートナーの標準コネクタ
現在、Web、CSV、DB(JDBC 4.0 以降)、SharePoint、Windowsファイルサーバ用のコネクターは無償で利用可能となっています。サードパーティ向けコネクタはユーザ側で独自に開発することも可能です。
弊社では、より高機能化したコネクタ製品のご提供を行っております。
スタンドアロン版実践
はじめに
それではスタンドアロン版を利用した実践解説をしていきます。
より分かり易くスタンドアロン版を体験していただきたいので、今回はコネクタ―は利用せずに手動でインデックス登録し、検索結果に反映されるところまでを解説します。
【事前準備】
1,スタンドアロン版を利用する場合には、Google Cloud Search スタンドアロンライセンスが必要となります。
2,GCS で利用するAPIの有効化やサービスアカウントは、GCPプロジェクトで行う必要があります。管理者アカウントや適切なロールが付与されたアカウントで作業を行う必要があります。API利用ですのでGCP側で課金が発生しません。
3,GWS の、特権管理者もしくは、CloudSearchロールが付与されたアカウントで作業を行う必要があります。
Google Cloud Search プロジェクト作成
既に利用できるプロジェクトをお持ちの場合には、こちらの手順は不要です。必要に応じて手順を実施してください。
まず、GCPコンソールにログインします。
1、画面上部のProject選択プルダウンをクリックし、表示されたポップアップより「新しいプロジェクト」をクリックします。
2、任意のプロジェクト名を入力し、下部の「作成」をクリックします。その際、場所(ドメイン)が間違っていないことを要確認。画面が遷移し、Project作成中になります。
3、プロジェクトが作成されると、上部のProject選択プルダウンから作成したプロジェクトが選択できるようになります。
Google Cloud Search API有効化
1、まず、現在のAPI状態を確認します。
画面上部の「APIとサービスを有効化」をクリックします。
2、APIライブラリ選択画面の検索ボックスに「CloudSearch」と入力します。「Cloud Search API」が表示されるので、その表示エリアをクリックします。
3、表示されたCloud Search APIの状態が「有効にする」と表示されていた場合、現在は無効の状態となります。「有効にする」をクリックし、有効化します。
データソースの追加
データソースとは、サードパーティのインデックスやコンテンツの登録先です。また、データソースにはスキーマ情報を登録することが可能で、スキーマを定義することでインデックス情報を構造的に格納することが可能となります。詳しくはこちらを確認してください。
この作業は GoogleWorkspace (CloudIdentity) の管理コンソール側での作業となります。
作業を行うためには、特権管理者もしくは、”CloudSearchAclMapping”、”Cloud Search Service”のロールを付与されたユーザで作業を行う必要があります。
1、Adminコンソールにログインし、「アプリ」→「G Suite」と選択します。
2、サービス一覧より「Cloud Search」を選択します。
遷移後の画面で「+」をクリックします。
3、新しいデータソースの情報を入力します。
|
(*1) 既に社内等でGCSをご利用頂いており、今回追加したデータソースの全社公開を避けたい場合には、”次のユーザだけに公開”を選択し、公開する特定のユーザのアドレスを入力してください。設定されたユーザ以外に公開されなくなります。
入力が完了したら「追加」をクリックします。
4、新しいデータソースが作成されたら「完了」をクリックします。
遷移後のデータソース一覧画面に追加されていることを確認します。
データソースの有効化
作成したデータソースを、検索アプリケーションで利用できるように設定を行います。
1、Adminコンソールの「Cloud Searchの設定」にて、「検索アプリケーション」を選択します。
2、「Default G Suite Search Application」の編集を選択します。
アプリケーションIDが、”default”は、GoogleCloudSearch標準の検索画面に対する設定変更となります。
3、データソースの編集を選択します。
4、該当するデータソースのスイッチをON(有効化)にします。
以上で、サードパーティデータを検索するための準備は整いました。
APIを利用しINDEXを登録
1、Google APIs ExplorerからIndex情報を登録します。
Chromeブラウザで、GoogleDeveloperサイトにアクセスします。
API実行時に Google 認証が必要になりますので、必要に応じてシークレットウィンドウで開いてください。
パラメータを入力し、[Execute]ボタンをクリックします。
Name |
datasources/{作成したデータソースID}/items/{一意の値 } |
Request body |
{ "item": { "acl": { "readers": [ { "gsuitePrincipal": { "gsuiteDomain": true } } ] }, "metadata": { "title": "Googleサイト", "sourceRepositoryUrl": "https://www.google.com" }, "version": "djE=", "itemType": "CONTENT_ITEM" }, "mode": "SYNCHRONOUS" } |
正常に登録された場合には、ステータス200がリターンされます。

検索してみる
それでは検索UIで登録されたインデックスを確認してみましょう。
https://cloudsearch.google.comにアクセスします。
登録したデータソースを参照することが出来ました。また、先ほど登録したインデックスデータが登録されていることも確認できます。
まとめ
今回は、スタンドアロン版を体験していただきましたが、いかがでしたでしょうか。GCS で簡単なインデックス情報の検索ができるところまで、体験いただけたかと思います。
次回は、Google が提供している「Google Cloud Search Norconex HTTP Collector Indexer Plugin」コネクタ―を利用して、ウェブサイトクロールの解説をしたいと思います。
- カテゴリ:
- Google Cloud Search
- キーワード:
- Google Cloud Search