データ キャンバスで分析する

BigQuery データ キャンバスを使用すると、自然言語を使用してデータの検出、変換、クエリ、可視化を行うことができます。BigQuery データ キャンバスは、有向非巡回グラフ(DAG)でデータソース、クエリ、可視化を操作できる、分析用のグラフィック インターフェースを提供します。これにより、メンタルモデルに対応した分析ワークフローを視覚的に確認できます。BigQuery データ キャンバスでは、クエリ結果に基づいて繰り返し処理を行うことができます。また、1 か所で複数の問い合わせ分岐を処理できます。

BigQuery データ キャンバスは、データから分析情報を導出するプロセスを支援するように設計されています。特定のツールやサービスに関する技術的な知識がなくても、データを扱うことができます。BigQuery データ キャンバスは、Dataplex メタデータと連携し、自然言語に基づいて適切なテーブルを識別します。

BigQuery データ キャンバスは、Gemini を使用して、データの検索、SQL の作成、グラフの生成、データの要約を行います。

機能

BigQuery データ キャンバスは、次の機能をサポートしています。

  • キーワード検索構文とテーブル、ビュー、マテリアライズド ビューなどの Dataplex メタデータを使用して、テーブル アセットを検索します。

  • 次のような簡単な SQL クエリに自然言語を使用します。

    • SELECT FROM、数学関数、配列、構造体を含むクエリ
    • 2 つのテーブル間の JOIN ステートメント
  • 次のグラフを使用した一般的な可視化:

    • 棒グラフ
    • ヒートマップ
    • 折れ線グラフ
    • 円グラフ
    • 散布図
  • カスタム ビジュアリゼーション。自然言語を使用して目的を説明できます。

  • データ分析の自動化

BigQuery データ キャンバスには次の制限があります。

  • 次の操作では、自然言語コマンドは使いづらい場合があります。

    • BigQuery ML
    • Apache Spark
    • オブジェクト テーブル
    • BigLake
    • INFORMATION_SCHEMA
    • JSON
    • ネストされたフィールドと繰り返しフィールド
    • 複雑な関数とデータ型(DATETIMETIMEZONE など)
  • Geomap グラフではデータの可視化は機能しません。

始める前に

BigQuery の Gemini 機能にアクセスするには、管理者が BigQuery で Gemini を有効にする必要があります。詳細については、BigQuery で Gemini を設定するをご覧ください。

BigQuery データ キャンバスを使用するために必要な権限を取得するには、プロジェクトに対する次の IAM ロールを付与するよう管理者に依頼します。

ロールの付与の詳細については、アクセス権の管理をご覧ください。

必要な権限は、カスタムロールや他の事前定義ロールから取得することもできます。

BigQuery データ キャンバスを操作する

BigQuery データ キャンバスを使用すると、自然言語向けのアプローチでデータを検出、変換、クエリ、可視化できます。次の例では、BigQuery データ キャンバスの操作方法の一部を示します。データの検出から可視化までのワークフローのサンプルも示します。

BigQuery データ キャンバスの使用を開始するには:

  1. Google Cloud コンソールに移動します。

    [BigQuery] に移動

  2. ナビゲーション メニューで [BigQuery Studio] をクリックします。

  3. [データ キャンバスを作成] をクリックします。テーブルまたはクエリから BigQuery データ キャンバスを直接開始することもできます。

  4. テキスト フィールドに、自然言語で最初のプロンプトを入力します。

次の例は、一般的な BigQuery データ キャンバスのワークフローを示しています。

例 1: 単一のテーブルを操作する

プロンプト 1: データを見つける

Chicago taxi trips

想定される結果:

BigQuery データ キャンバスは、Dataplex メタデータに基づいて、使用可能なテーブルのリストを生成します。複数のテーブルを選択できます。各テーブルには、[キャンバスに追加]、[クエリ]、[詳細] のオプションがあります。この例では、bigquery-public-data.chicago_taxi_trips.taxi_trips テーブルを選択して [キャンバスに追加] をクリックします。

taxi_trips のテーブルセルが BigQuery データ キャンバスに追加されます。テーブルセルのタブを切り替えると、スキーマ情報、テーブルの詳細、データのプレビューを表示できます。

[クエリ] をクリックして、このテーブルに自然言語でクエリを実行します。

プロンプト 2: 選択したテーブルから SQL クエリを作成する

Get me the 100 longest trips

想定される結果:

BigQuery データ キャンバスは、次のような SQL クエリを生成します。

SELECT
  taxi_id,
  trip_start_timestamp,
  trip_end_timestamp,
  trip_miles
FROM
  `bigquery-public-data.chicago_taxi_trips.taxi_trips`
ORDER BY
  trip_miles DESC
LIMIT
  100;
  

SQL クエリを手動で編集するか、自然言語プロンプトを変更してクエリを再作成することで、クエリを編集することもできます。この例では、顧客が現金で支払ったルートのみを選択するように、自然言語プロンプトを編集します。

プロンプト 3: プロンプトを変更してクエリを編集する

Get me the 100 longest trips where the payment type is cash

想定される結果

BigQuery データ キャンバスは、次のような SQL クエリを生成します。

SELECT
  taxi_id,
  trip_start_timestamp,
  trip_end_timestamp,
  trip_miles
FROM
  `daui-storage.chicago_taxi_trips_123123.taxi_trips`
WHERE
  payment_type = 'Cash'
ORDER BY
  trip_miles DESC
LIMIT
  100;
  

[実行] をクリックして、クエリの結果を表示します。

プロンプト 4: グラフを作成する

  1. [可視化] をクリックします。
  2. [棒グラフの作成] をクリックします。

想定される結果

BigQuery データ キャンバスで、ルート ID ごとに最も移動距離の長いルートを表示する棒グラフを作成します。

BigQuery データ キャンバスでは、グラフだけでなく、可視化の基となるデータの主な情報が要約されます。グラフを変更するには、[Visualization details] をクリックして、サイドパネルでグラフを編集します。

BigQuery データ キャンバスを共有する場合は、[共有] をクリックし、[リンクを共有] をクリックして、BigQuery データ キャンバスのリンクをコピーします。

BigQuery データ キャンバスをクリーンアップするには、[キャンバスを消去] をクリックします。空白のキャンバスが表示されます。

例 2: 複数のテーブルを処理する

プロンプト 1:

Information about trees

想定される結果:

BigQuery データ キャンバスには、ツリーに関する情報を含むテーブルがいくつか表示されます。この例では、2 つのテーブル(bigquery-public-data.new_york_trees.tree_census_1995bigquery-public-data.new_york_trees.tree_census_2015)を使用します。

両方のテーブルを選択してキャンバスに表示します。

この例では、bigquery-public-data.new_york_trees.tree_census_1995 テーブルの [結合] をクリックして、2 つのテーブルを結合します。BigQuery データ キャンバスに、結合するテーブルの候補が表示されます。bigquery-public-data.new_york_trees.tree_census_2015 を選択します。新しいペインが表示され、各テーブルへの接続が表示されます。

プロンプト 2:

Join these tables on their address

想定される結果

SELECT
  *
FROM
  `bigquery-public-data.new_york_trees.tree_census_2015` AS t2015
JOIN
  `bigquery-public-data.new_york_trees.tree_census_1995` AS t1995
ON
  t2015.address = t1995.address;

BigQuery データ キャンバスで、これらの 2 つのテーブルをアドレスで結合する SQL クエリが提案されます。[実行] をクリックしてクエリを実行し、結果を表示します。

BigQuery データ キャンバスでは、クエリをノートブックとしてエクスポートできます。ノートブックにエクスポートするには:

  1. [ノートブックとしてエクスポート] タブをクリックします。
  2. [ノートブックに名前を付けて保存] ペインで、保存するノートブックの名前と保存先のリージョンを入力します。
  3. [保存] をクリックします。ノートブックが正常に作成されます。
  4. [Open in BQ Studio] をクリックして、作成したノートブックを確認します。

例 3

プロンプト 1

Find data about USA names

想定される結果

BigQuery データ キャンバスがテーブルのリストを生成します。この例では、bigquery-public-data.usa_names.usa_1910_current テーブルを選択します。

[クエリ] をクリックして、データをクエリします。プロンプトを入力してデータをクエリします。

想定される結果

BigQuery データ キャンバスが次のクエリを生成します。

SELECT
  state,
  gender,
  year,
  name,
  number
FROM
  `bigquery-public-data.usa_names.usa_1910_current`

BigQuery データ キャンバスがクエリの結果を生成します。このデータをフィルタするために、追加のクエリを実行します。[これらの結果に対してクエリを実行する] をクリックします。

プロンプト 2

Get me the top 10 most popular names in 1980

想定される結果

BigQuery データ キャンバスが次のクエリを生成します。

SELECT
  name,
  SUM(number) AS total_count
FROM
  `bigquery-public-data`.usa_names.usa_1910_current
WHERE
  year = 1980
GROUP BY
  name
ORDER BY
  total_count DESC
LIMIT
  10;

クエリを実行すると、1980 年に生まれた子供の最も一般的な名前を 10 個含むテーブルが返されます。

この例では、これらの結果を可視化します。[可視化] をクリックします。BigQuery データ キャンバスに、棒グラフ、円グラフ、折れ線グラフ、カスタム可視化など、可視化オプションの候補が表示されます。[棒グラフの作成] をクリックします。

BigQuery データ キャンバスで、次のような棒グラフが作成されます。

上位 10 個の名前の棒グラフ。

BigQuery データ キャンバスでは、グラフだけでなく、可視化の基となるデータの主な情報が要約されます。グラフを変更するには、[Visualization details] をクリックして、サイドパネルでグラフを編集します。

プロンプト 3

Create a bar chart sorted high to low, with a gradient

想定される結果

BigQuery データ キャンバスで、次のような棒グラフが作成されます。

上位 10 個の名前を並べた棒グラフ。

変更を加えるには、[Visualization details] をクリックします。Vis の詳細サイドバーが表示されます。グラフのタイトル、X 軸の名前、Y 軸の名前などを編集できます。また、[JSON] タブをクリックすると、JSON 値に基づいてグラフを直接編集できます。

フィードバックを送信する

Google にフィードバックを送信して、BigQuery データ キャンバスの候補の改善にご協力ください。フィードバックを送信するには:

  1. Google Cloud コンソールのツールバーで、[フィードバックを送信] をクリックします。

  2. (省略可)DAG JSON 情報をコピーするには、[ コピー] をクリックします。これにより、フィードバックに追加のコンテキストを提供できます。

  3. [フォーム] をクリックして、フォームに記入してフィードバックを送信します。

データ共有設定はプロジェクト全体に適用されます。これは、serviceusage.services.enableserviceusage.services.list の IAM 権限を持つプロジェクト管理者のみ設定できます。Trusted Tester プログラムでのデータの使用について詳しくは、Google Cloud Trusted Tester プログラムの Gemini をご覧ください。

この機能に関するフィードバックを直接送信するには、[email protected] 宛てにメールをお送りください。

次のステップ