Usar o Imagen na legenda visual da Vertex AI e na Resposta visual a perguntas (VQA, na sigla em inglês) para receber informações de imagem (Console)
Saiba como usar o Imagen nos recursos de legendagem visual e resposta a perguntas visuais (VQA, na sigla em inglês) da Vertex AI para receber informações de texto sobre uma imagem. Neste guia de início rápido, mostramos como usar legendas visuais e o VQA no Console do Google Cloud.
Antes de começar
- Faça login na sua conta do Google Cloud. Se você começou a usar o Google Cloud agora, crie uma conta para avaliar o desempenho de nossos produtos em situações reais. Clientes novos também recebem US$ 300 em créditos para executar, testar e implantar cargas de trabalho.
-
No console do Google Cloud, na página do seletor de projetos, selecione ou crie um projeto do Google Cloud.
-
Verifique se a cobrança está ativada para o seu projeto do Google Cloud.
-
Ative a API Vertex AI.
-
No console do Google Cloud, na página do seletor de projetos, selecione ou crie um projeto do Google Cloud.
-
Verifique se a cobrança está ativada para o seu projeto do Google Cloud.
-
Ative a API Vertex AI.
Acessar a imagem de amostra
Depois de configurar o ambiente, é possível receber uma imagem de amostra e usar legendas visuais e o recurso Resposta visual a perguntas para conseguir informações sobre a imagem.
Para conseguir a imagem de amostra, faça o download da imagem diretamente do Cloud Storage ou use o seguinte comando para salvá-la no diretório atual:
curl -O https://storage.googleapis.com/cloud-samples-data/generative-ai/image/vcap-vqa-quickstart_fish.jpg
Gerar descrições de imagens com legendas visuais
Depois de receber a imagem de amostra, você pode enviar a solicitação de legenda visual para conseguir uma descrição em texto da imagem.
Console
No console do Google Cloud, abra a guia Vertex AI Studio > Visão no painel da Vertex AI.
No menu inferior, clique em
Legenda.Clique em Fazer upload da imagem e selecione a imagem local para legendar.
No painel Parâmetros, defina o seguinte:
- Número de legendas: selecione
2
. - Idioma: se ainda não tiver selecionado, escolha
English (en)
.
- Número de legendas: selecione
Clique em
Gerar legendas.
Gerar respostas para perguntas com o VQA
Por fim, você pode usar a mesma imagem para fazer uma pergunta sobre ela e receber uma resposta usando o recurso VQA.
Console
No console do Google Cloud, abra a guia Vertex AI Studio > Visão no painel da Vertex AI.
No menu inferior, clique em
Perguntas e respostas visuais.Clique em Fazer upload da imagem e selecione a imagem local.
No painel Parâmetros, selecione "2" como o Número de respostas.
No campo (Faça uma pergunta aqui) digite o seguinte:
What color is the left fish?
Clique em
Gerar.
Parabéns! Você acabou de usar os recursos de legendagem visual e VQA do Imagen para conseguir informações sobre uma imagem.
Limpeza
Para evitar cobranças na conta do Google Cloud pelos recursos usados nesta página, siga estas etapas.
Excluir o projeto
- No Console do Google Cloud, acesse a página Gerenciar recursos.
- Na lista de projetos, selecione o projeto que você quer excluir e clique em Excluir .
- Na caixa de diálogo, digite o ID do projeto e clique em Encerrar para excluí-lo.
A seguir
- Leia as diretrizes de uso do Imagen na Vertex AI.
- Confira modelos pré-treinados no Model Garden.
- Saiba mais sobre as práticas recomendadas de IA responsável e os filtros de segurança da Vertex AI.