Che cos'è BI Engine?

BigQuery BI Engine è un servizio di analisi in memoria rapido che accelera molte query SQL in BigQuery mediante la memorizzazione intelligente nella cache dei dati che utilizzi più di frequente. BI Engine può accelerare le query SQL da qualsiasi origine, comprese quelle scritte da strumenti di visualizzazione dei dati, e può gestire le tabelle memorizzate nella cache per l'ottimizzazione continua. Ciò consente di migliorare le prestazioni delle query senza l'ottimizzazione manuale o il raggruppamento dei dati in livelli. Puoi utilizzare il clustering e il partizionamento per ottimizzare ulteriormente le prestazioni delle tabelle di grandi dimensioni con BI Engine.

Ad esempio, se la dashboard mostra solo i dati dell'ultimo trimestre, valuta la possibilità di partizionare le tabelle in base all'ora in modo che vengano caricate in memoria solo le partizioni più recenti. Puoi anche combinare i vantaggi delle viste materializzate e di BI Engine. Questo funziona particolarmente bene quando le viste materializzate vengono utilizzate per unire e suddividere i dati al fine di ottimizzare la loro struttura per BI Engine.

BI Engine offre i seguenti vantaggi:

  1. API BigQuery: BI Engine si integra direttamente con l'API BigQuery. Qualsiasi soluzione BI o applicazione personalizzata che funziona con l'API BigQuery tramite meccanismi standard come REST o driver JDBC e ODBC può utilizzare BI Engine senza modifiche.
  2. Runtime vettoriale: con l'interfaccia SQL di BI Engine, BI Engine introduce una tecnica più moderna chiamata elaborazione vettoriale. L'utilizzo dell'elaborazione vettoriale in un motore di esecuzione consente un uso più efficiente dell'architettura moderna della CPU, operando su batch di dati alla volta. BI Engine utilizza inoltre codifiche avanzate dei dati, in particolare la codifica di dizionario e lunghezza di esecuzione, per comprimere ulteriormente i dati archiviati nel livello in memoria.
  3. Integrazione perfetta: BI Engine funziona con le funzionalità e i metadati di BigQuery, tra cui viste autorizzate, sicurezza a livello di colonna e riga e mascheramento dei dati.
  4. Prenotazioni: le prenotazioni di BI Engine gestiscono l'allocazione della memoria a livello di località del progetto. BI Engine memorizza nella cache le colonne o le partizioni specifiche oggetto di query, dando la priorità a quelle nelle tabelle contrassegnate come preferite.

Informazioni sull'interfaccia SQL di BI Engine

L'interfaccia SQL di BI Engine espande BI Engine per integrarsi con altri strumenti di business intelligence (BI) come Looker, Tableau, Power BI e applicazioni personalizzate per accelerare l'esplorazione e l'analisi dei dati. Questa pagina fornisce una panoramica dell'interfaccia SQL di BI Engine e delle funzionalità espanse che offre a BI Engine.

Architettura di BI Engine

Casi d'uso di BI Engine

BI Engine può accelerare notevolmente molte query SQL, incluse quelle utilizzate per le dashboard BI. L'accelerazione è più efficace se identifichi le tabelle essenziali per le tue query e le contrassegni come tabelle preferite. Per utilizzare BI Engine, crea una prenotazione che definisca la capacità di archiviazione dedicata a BI Engine. Puoi consentire a BigQuery di determinare quali tabelle memorizzare nella cache in base ai pattern di utilizzo del progetto oppure puoi contrassegnare tabelle specifiche per evitare che altro traffico interferisca con l'accelerazione.

BI Engine è utile nei seguenti casi d'uso:

  • Utilizza gli strumenti BI per analizzare i dati: l'interfaccia SQL di BI Engine può accelerare le query di BigQuery indipendentemente dal fatto che vengano eseguite nella console di BigQuery, nella libreria client o tramite un'API o un connettore ODBC o JDBC. Ciò può migliorare notevolmente le prestazioni delle dashboard connesse a BigQuery tramite una connessione (API) o connettori integrati.
  • Alcune tabelle vengono sottoposte più spesso a query: BI Engine consente di indicare tabelle preferite specifiche per l'accelerazione. Questa operazione è utile se hai un sottoinsieme di tabelle su cui vengono eseguite query più spesso o che vengono utilizzate per dashboard ad alta visibilità.

BI Engine potrebbe non soddisfare le tue esigenze nei seguenti casi:

  • Utilizzo di caratteri jolly nelle query: le query che fanno riferimento a tabelle con caratteri jolly non sono supportate da BI Engine e non traggono vantaggio dall'accelerazione.

  • Fai affidamento molto sulle funzionalità di BigQuery non supportate: sebbene BI Engine supporti la maggior parte delle funzioni e degli operatori SQL per la connessione degli strumenti di business intelligence (BI) a BigQuery, esistono funzionalità non supportate, tra cui le tabelle esterne e le funzioni non SQL definite dall'utente.

Considerazioni su BI Engine

Quando decidi come configurare BI Engine, considera i seguenti aspetti:

Garantisci l'accelerazione per query specifiche

Per assicurarti che un determinato insieme di query venga sempre accelerato, crea un progetto separato con una prenotazione di BI Engine. Per farlo, devi assicurarti che la prenotazione di BI Engine nel progetto sia sufficientemente grande da corrispondere alle dimensioni di tutte le tabelle utilizzate nelle query e designare queste tabelle come tabelle preferite per BI Engine. Solo le query che devono essere accelerate devono essere eseguite in quel progetto.

Riduci a icona i join

BI Engine funziona meglio con i dati pre-uniti o preaggregati e con dati in un numero limitato di unioni. Ciò è particolarmente vero quando un lato del join è grande e gli altri sono molto più piccoli, ad esempio quando esegui una query su una tabella dei fatti di grandi dimensioni unita a una tabella di dimensioni ridotte. Puoi combinare BI Engine con viste materializzate che eseguono unioni per produrre un'unica tabella piatta di grandi dimensioni. In questo modo, non è necessario eseguire gli stessi join per ogni query.

Comprendere l'impatto di BI Engine

Per comprendere meglio in che modo i tuoi carichi di lavoro traggono vantaggio da BI Engine esaminando le statistiche sull'utilizzo in Cloud Monitoring o eseguendo query su INFORMATION_SCHEMA in BigQuery. Assicurati di disattivare l'opzione Utilizza risultati memorizzati nella cache in BigQuery per ottenere il confronto più accurato. Per ulteriori informazioni, consulta Utilizzare i risultati delle query memorizzati nella cache.

Quote e limitazioni

Consulta Quote e limiti di BigQuery per conoscere le quote e i limiti che si applicano a BI Engine.

Prezzi

Per informazioni sui prezzi di BI Engine, consulta la pagina Prezzi di BigQuery.

Ottimizzazione e accelerazione delle query

BigQuery e, per estensione, BI Engine suddivide in sottoquery il piano di query generato per una query SQL. Una sottoquery contiene una serie di operazioni, come la scansione, l'applicazione di filtri o l'aggregazione dei dati, e spesso è l'unità di esecuzione su uno shard.

Sebbene tutte le query SQL supportate da BigQuery vengano eseguite correttamente dall'interfaccia SQL di BI Engine, solo alcune sottoquery vengono ottimizzate. In particolare, l'interfaccia SQL di BI Engine è ottimizzata principalmente per le sottoquery a livello di foglia che analizzano i dati dall'archiviazione ed eseguono operazioni come filtro, calcolo, aggregazione, ordine per e determinati tipi di join. Altre sottoquery che non sono ancora completamente accelerate da BI Engine tornano a BigQuery per l'esecuzione.

Grazie a questa ottimizzazione selettiva, le query di business intelligence più semplici o di tipo dashboard traggono il massimo vantaggio da BI Engine (con un conseguente minor numero di sottoquery), poiché la maggior parte del tempo di esecuzione viene dedicata a sottoquery a livello di foglia che elaborano dati non elaborati.

Passaggi successivi