Crea e configura una connessione alle risorse Cloud
In qualità di amministratore BigQuery, puoi creare una connessione alle risorse Cloud che consente ai data analyst di eseguire le seguenti attività:
- Esegui query su dati strutturati Cloud Storage utilizzando le tabelle BigLake. Le tabelle BigLake consentono di eseguire query su dati esterni con la delega di accesso.
- Esegui query su dati non strutturati in Cloud Storage utilizzando le tabelle di oggetti.
- Implementa le funzioni remote con qualsiasi linguaggio supportato in Cloud Functions o Cloud Run.
Per ulteriori informazioni sulle connessioni, consulta Introduzione alle connessioni.
Prima di iniziare
Abilita l'API BigQuery Connection.
-
Per ottenere le autorizzazioni necessarie per creare una connessione risorsa Cloud, chiedi all'amministratore di concederti i seguenti ruoli IAM:
-
Amministratore connessione BigQuery (
roles/bigquery.connectionAdmin
) sul progetto -
Visualizzatore oggetti Storage (
roles/storage.objectViewer
) nel bucket
Per saperne di più sulla concessione dei ruoli, consulta Gestire l'accesso.
Potresti anche essere in grado di ottenere le autorizzazioni richieste tramite i ruoli personalizzati o altri ruoli predefiniti.
Se vuoi eseguire query su dati strutturati con tabelle BigLake basate su Cloud Storage o dati non strutturati con tabelle di oggetti, l'account di servizio associato alla connessione deve anche avere il ruolo Visualizzatore Storage (roles/storage.viewer
) per il bucket che contiene i dati esterni.
-
Amministratore connessione BigQuery (
- Assicurati che la tua versione di Google Cloud SDK sia 366.0.0 o successiva:
gcloud version
Se necessario, aggiorna Google Cloud SDK.
- (Facoltativo) Per Terraform, utilizza Terraform versione di Google Cloud 4.25.0 o versioni successive. Puoi scaricare la versione più recente dai download di HashiCorp Terraform.
Considerazione località
Quando usi Cloud Storage per archiviare i file di dati, ti consigliamo di utilizzare bucket Cloud Storage a una singola regione o a due regioni per ottenere prestazioni ottimali, non bucket multiregionali.
crea connessioni alle risorse Cloud
BigLake utilizza una connessione per accedere a Cloud Storage. Puoi utilizzare questa connessione con una singola tabella o un gruppo di tabelle.
Seleziona una delle seguenti opzioni:
Console
Vai alla pagina BigQuery.
Per creare una connessione, fai clic su
Aggiungi e poi su Connessioni a origini dati esterne.Nell'elenco Tipo di connessione, seleziona Modelli remoti Vertex AI, funzioni remote e BigLake (risorsa Cloud).
Nel campo ID connessione, inserisci un nome per la connessione.
Fai clic su Crea connessione.
Fai clic su Vai alla connessione.
Nel riquadro Informazioni sulla connessione, copia l'ID account di servizio da utilizzare in un passaggio successivo.
bq
In un ambiente a riga di comando, crea una connessione:
bq mk --connection --location=REGION --project_id=PROJECT_ID \ --connection_type=CLOUD_RESOURCE CONNECTION_ID
Il parametro
--project_id
sostituisce il progetto predefinito.Sostituisci quanto segue:
REGION
: la tua regione di connessionePROJECT_ID
: l'ID del tuo progetto Google CloudCONNECTION_ID
: un ID per la tua connessione
Quando crei una risorsa di connessione, BigQuery crea un account di servizio di sistema univoco e lo associa alla connessione.
Risoluzione dei problemi: se visualizzi il seguente errore di connessione, aggiorna Google Cloud SDK:
Flags parsing error: flag --connection_type=CLOUD_RESOURCE: value should be one of...
Recupera e copia l'ID account di servizio per utilizzarlo in un passaggio successivo:
bq show --connection PROJECT_ID.REGION.CONNECTION_ID
L'output è simile al seguente:
name properties 1234.REGION.CONNECTION_ID {"serviceAccountId": "connection-1234-9u56h9@gcp-sa-bigquery-condel.iam.gserviceaccount.com"}
Terraform
Aggiungi la sezione seguente al file main.tf
.
## This creates a cloud resource connection. ## Note: The cloud resource nested object has only one output only field - serviceAccountId. resource "google_bigquery_connection" "connection" { connection_id = "CONNECTION_ID" project = "PROJECT_ID" location = "REGION" cloud_resource {} }Sostituisci quanto segue:
CONNECTION_ID
: un ID per la tua connessionePROJECT_ID
: l'ID del tuo progetto Google CloudREGION
: la tua regione di connessione
Concedi l'accesso all'account di servizio
Se vuoi creare funzioni remote, devi concedere i ruoli richiesti a Cloud Functions o Cloud Run.
Se vuoi connetterti a Cloud Storage, devi concedere alla nuova connessione l'accesso di sola lettura a Cloud Storage in modo che BigQuery possa accedere ai file per conto degli utenti.
Seleziona una delle seguenti opzioni:
Console
Ti consigliamo di concedere all'account di servizio della risorsa di connessione il ruolo IAM Visualizzatore oggetti Storage (roles/storage.objectViewer
), che consente all'account di servizio di accedere ai bucket Cloud Storage.
Vai alla pagina IAM e amministrazione.
Fai clic su
Aggiungi.Viene visualizzata la finestra di dialogo Aggiungi entità.
Nel campo Nuove entità, inserisci l'ID account di servizio che hai copiato in precedenza.
Nel campo Seleziona un ruolo, seleziona Cloud Storage e poi Visualizzatore oggetti Storage.
Fai clic su Salva.
gsutil
Utilizza il comando gsutil iam ch
:
gsutil iam ch serviceAccount:MEMBER:objectViewer gs://example-bucket
Sostituisci MEMBER
con l'ID dell'account di servizio che hai
copiato in precedenza.
Per saperne di più, consulta Aggiungere un'entità a un criterio a livello di bucket.
Terraform
Aggiungi la seguente sezione al file main.tf
.
## This grants permissions to the service account of the connection created in the last step. resource "google_project_iam_member" "connectionPermissionGrant" { project = "PROJECT_ID" role = "roles/storage.objectViewer" member = format("serviceAccount:%s", google_bigquery_connection.connection.cloud_resource[0].service_account_id) }
Condividere i contatti con gli utenti
Puoi concedere i ruoli seguenti per consentire agli utenti di eseguire query sui dati e gestire le connessioni:
roles/bigquery.connectionUser
: consente agli utenti di utilizzare le connessioni per connettersi a origini dati esterne ed eseguire query su di esse.roles/bigquery.connectionAdmin
: consente agli utenti di gestire le connessioni.
Per ulteriori informazioni sui ruoli e sulle autorizzazioni IAM in BigQuery, consulta Autorizzazioni e ruoli predefiniti.
Seleziona una delle seguenti opzioni:
Console
Vai alla pagina BigQuery.
Le connessioni sono elencate nel progetto in un gruppo chiamato Connessioni esterne.
Nel riquadro Explorer, fai clic sul nome del progetto > Connessioni esterne > connessione.
Nel riquadro Dettagli, fai clic su Condividi per condividere una connessione. Quindi:
Nella finestra di dialogo Autorizzazioni di connessione, condividi la connessione con altre entità aggiungendo o modificando entità.
Fai clic su Salva.
bq
Non puoi condividere una connessione con lo strumento a riga di comando bq. Per condividere una connessione, utilizza la console Google Cloud o il metodo dell'API BigQuery Connections per condividere una connessione.
API
Utilizza il metodo projects.locations.connections.setIAM
nella sezione di riferimento dell'API REST BigQuery Connections e fornisci un'istanza della risorsa policy
.
Java
Prima di provare questo esempio, segui le istruzioni di configurazione di Java disponibili nella guida rapida di BigQuery sull'utilizzo delle librerie client. Per saperne di più, consulta la documentazione di riferimento dell'API BigQuery Java.
Per eseguire l'autenticazione in BigQuery, configura Credenziali predefinite dell'applicazione. Per maggiori informazioni, consulta Configurare l'autenticazione per le librerie client.
Passaggi successivi
- Scopri di più sui diversi tipi di connessione.
- Scopri di più sulla gestione delle connessioni.
- Scopri di più sulle tabelle BigLake.
- Scopri come creare tabelle BigLake.
- Scopri come eseguire l'upgrade delle tabelle esterne a tabelle BigLake.
- Scopri di più sulle tabelle degli oggetti e su come crearle.
- Scopri come implementare le funzioni remote.