Ir para

O que é o Presto?

O Presto é um mecanismo de consulta SQL distribuído de código aberto criado pelos desenvolvedores do Facebook para executar análises interativas em grandes volumes de dados. Com o Presto, as organizações podem simplesmente usar suas habilidades de SQL para consultar Big Data sem precisar aprender novas linguagens complexas.

Saiba como o Presto no Dataproc pode acelerar a análise de dados.

Pronto para começar? Clientes novos recebem US$ 300 em créditos para usar no Google Cloud.

Definição do Presto

O Presto (mecanismo de consulta SQL) de código aberto usa a linguagem de consulta SQL padrão do setor para fornecer uma maneira rápida e fácil de processar e executar análises ad hoc de Big Data em várias fontes, em sistemas locais e de nuvem.

A arquitetura Presto é muito semelhante aos sistemas de processamento analítico on-line (OLAP, na sigla em inglês) clássico que usam computação distribuída, em que um nó mestre coordena vários nós de trabalho.

Resolva seus desafios mais difíceis com o Google Cloud

Clientes novos recebem US$ 300 em créditos para usar no Google Cloud.
Comece agora
Fale com um especialista em vendas do Google Cloud para discutir seu desafio exclusivo em mais detalhes.
Fale conosco

Qual é a finalidade do Presto?

Com o Presto, as organizações podem executar continuamente consultas federadas em repositórios de dados em grande escala, como BigQuery, Hadoop Distributed File System, Cloud Storage, Cloud SQL para MySQL, Apache Cassandra ou Apache Kafka. Veja alguns casos de uso específicos.

Armazenamento de dados

Com o Presto, é possível executar uma consulta de mecanismo de banco de dados, como as cargas de trabalho OLAP tradicionais, usando um mecanismo de consulta SQL aberto e distribuído.

Inteligência empresarial ad hoc

Para exploração rápida de dados e geração de relatórios simples, crie um pequeno mecanismo de consulta Presto para executar consultas em várias fontes de dados e, em seguida, desligue.

Preparação leve de dados

Juntar e agregar dados rapidamente para preparar o conjunto de dados e as variáveis derivadas para consultas ad hoc.

O componente opcional do Presto para Dataproc traz o pacote completo de suporte do Google Cloud, incluindo tempos de inicialização de cluster rápidos e testes de integração com o restante do Dataproc.

O BigQuery e o Cloud Storage podem fazer parte de uma solução do Google Cloud usando o Dataproc e o componente do mecanismo de consulta do Presto para análise de dados.