APIs de IA para Google Cloud

Integra la IA en tus aplicaciones con facilidad mediante las APIs de IA y aprendizaje automático de Google Cloud. Los clientes nuevos obtienen $300 en créditos gratuitos para ejecutar, probar e implementar cargas de trabajo. 

Hombre con una computadora
Caso de usoAPIs Ideal para
APIs de la IA generativa

Modelos grandes para tareas múltiples previamente entrenados, como Gemini, que se pueden ajustar o personalizar para tareas específicas con Vertex AI. Estos modelos multimodales de Google pueden controlar visión, diálogo, generación de código, finalización de código y mucho más.

  • Generación de incorporaciones de texto, chat de varios turnos y finalización de texto

  • Generación y finalización del código con Codey

  • Genera y personaliza imágenes con Imagen

  • Modelos de voz universales

Proporciona la organización paso a paso de la búsqueda empresarial y las aplicaciones de conversación con flujos de trabajo prediseñados para tareas comunes, como la integración, la transferencia de datos y la personalización.

  • Compila una app de búsqueda con calidad de Google a partir de tus propios datos

  • Cómo compilar apps multimodales que puedan responder con texto, imágenes y otro contenido multimedia

  • Resumen basado en la IA generativa

APIs de aprendizaje automático

Entrena modelos personalizados de aprendizaje automático de alta calidad casi sin esfuerzo ni experiencia en el tema. 

  • Entrenamiento de AA personalizado 

  • Prueba, supervisa y ajusta modelos de AA 

  • Implementación de más de 100 modelos, incluidos modelos multimodales y de base como Gemini

APIs de voz, texto y lenguaje

Obtén información valiosa a partir de texto no estructurado con el aprendizaje automático de Google

  • Aplica la comprensión del lenguaje natural a las apps con la API de Natural Language

  • Entrena tus modelos de AA abiertos para clasificar, extraer y detectar opiniones

Convierte voz en texto con precisión mediante una API impulsada por las tecnologías de IA de Google.

  • Reconocimiento de voz automático

  • Transcripciones en tiempo real

  • Modelos mejorados de llamadas telefónicas en Google Contact Center AI

Convierte texto en voz natural a través de una API potenciada por la IA de Google. 

  • Mejora las interacciones con los clientes. 

  • Interfaz de usuario de Voice en dispositivos y aplicaciones

  • Comunicación personalizada 

Haga que su contenido sea multilingüe con traducción automática, rápida y dinámica.

  • Traducción en tiempo real

  • Localización atractiva del contenido

  • Internacionaliza tus productos

APIs de imagen y video

Integra funciones de detección de visión, como el etiquetado de imágenes, la detección de rostros y puntos de referencia, el reconocimiento óptico de caracteres (OCR) y el etiquetado de contenido explícito. 

  • Predice y comprende con precisión imágenes con AA

  • Clasificar con rapidez imágenes en millones de categorías predefinidas

Habilita el descubrimiento de contenido valioso y experiencias de video atractivas.

  • Extrae metadatos enriquecidos a nivel de video, toma o fotograma

  • Análisis de video que reconoce más de 20,000 objetos, lugares y acciones en los videos

APIs de documentos y datos

Modelos previamente entrenados para el procesamiento de documentos, incluidos extractores básicos como OCR y Analizador de formularios, y modelos especializados para casos de uso en la industria como préstamos, contratos, adquisición y documentos de identidad.

  • Extrae, clasifica y divide datos de documentos 

  • Reduce el procesamiento manual de documentos y minimiza los costos de configuración

  • Obtener estadísticas a partir de datos de documentos

Plataforma integrada y basada en la nube para almacenar, buscar, organizar, administrar y analizar documentos y sus metadatos estructurados. 

  • Control de acceso detallado (permisos) a nivel del documento y de la carpeta

  • Administra metadatos extraídos y etiquetados

APIs de IA conversacional

Plataforma de IA conversacional con capacidades de LLM basadas en IA generativa y en intents para crear experiencias de conversación naturales y enriquecidas en aplicaciones web y para dispositivos móviles, dispositivos inteligentes, bots, sistemas de respuesta de voz interactiva y plataformas de mensajería populares y mucho más. 

  • Interacciones naturales para conversaciones complejas de varios turnos

  • Compila e implementa agentes avanzados con rapidez

  • Escalabilidad de nivel empresarial

  • Compila un chatbot basado en un sitio web o una colección de documentos

Modelos grandes para tareas múltiples previamente entrenados, como Gemini, que se pueden ajustar o personalizar para tareas específicas con Vertex AI. Estos modelos multimodales de Google pueden controlar visión, diálogo, generación de código, finalización de código y mucho más.

  • Generación de incorporaciones de texto, chat de varios turnos y finalización de texto

  • Generación y finalización del código con Codey

  • Genera y personaliza imágenes con Imagen

  • Modelos de voz universales

Entrena modelos personalizados de aprendizaje automático de alta calidad casi sin esfuerzo ni experiencia en el tema. 

  • Entrenamiento de AA personalizado 

  • Prueba, supervisa y ajusta modelos de AA 

  • Implementación de más de 100 modelos, incluidos modelos multimodales y de base como Gemini

Obtén información valiosa a partir de texto no estructurado con el aprendizaje automático de Google

  • Aplica la comprensión del lenguaje natural a las apps con la API de Natural Language

  • Entrena tus modelos de AA abiertos para clasificar, extraer y detectar opiniones

Integra funciones de detección de visión, como el etiquetado de imágenes, la detección de rostros y puntos de referencia, el reconocimiento óptico de caracteres (OCR) y el etiquetado de contenido explícito. 

  • Predice y comprende con precisión imágenes con AA

  • Clasificar con rapidez imágenes en millones de categorías predefinidas

Modelos previamente entrenados para el procesamiento de documentos, incluidos extractores básicos como OCR y Analizador de formularios, y modelos especializados para casos de uso en la industria como préstamos, contratos, adquisición y documentos de identidad.

  • Extrae, clasifica y divide datos de documentos 

  • Reduce el procesamiento manual de documentos y minimiza los costos de configuración

  • Obtener estadísticas a partir de datos de documentos

Plataforma de IA conversacional con capacidades de LLM basadas en IA generativa y en intents para crear experiencias de conversación naturales y enriquecidas en aplicaciones web y para dispositivos móviles, dispositivos inteligentes, bots, sistemas de respuesta de voz interactiva y plataformas de mensajería populares y mucho más. 

  • Interacciones naturales para conversaciones complejas de varios turnos

  • Compila e implementa agentes avanzados con rapidez

  • Escalabilidad de nivel empresarial

  • Compila un chatbot basado en un sitio web o una colección de documentos

¿Estás listo para comenzar a compilar con IA?

Libera el poder de la IA con herramientas y servicios para cualquier nivel de habilidad.
Descubre cómo la IA generativa se ajusta a todo el ciclo de vida del desarrollo de software.

Los productos de IA de Cloud satisfacen las políticas de nuestros ANS. Es posible que ofrezcan garantías de latencia o disponibilidad distintas de otros servicios de Google Cloud.

Da el siguiente paso

Comienza a desarrollar en Google Cloud con el crédito gratis de $300 y los más de 20 productos del nivel Siempre gratuito.

Google Cloud
  • ‪English‬
  • ‪Deutsch‬
  • ‪Español‬
  • ‪Español (Latinoamérica)‬
  • ‪Français‬
  • ‪Indonesia‬
  • ‪Italiano‬
  • ‪Português (Brasil)‬
  • ‪简体中文‬
  • ‪繁體中文‬
  • ‪日本語‬
  • ‪한국어‬
Consola
Google Cloud