Con un prezzo che ti aiuta a far conoscere la tua app nel mondo
Disponibili ora
Disponibili ora
Disponibili ora
Il nostro modello multimodale più veloce con ottime prestazioni per attività diverse e ripetitive e una finestra di contesto da 1 milione. Ora in disponibilità generale per l'uso in produzione.
Senza costi*
Limiti di frequenza**
15 RPM (richieste al minuto)
1 milione di TPM (token al minuto)
1500 RPD (richieste al giorno)
Prezzo (input)
Senza costi
Memorizzazione nella cache contestuale (disponibile a breve)
Non applicabile
Prezzo (output)
Senza costi
Prompt/risposte utilizzati per migliorare i nostri prodotti
Pagamento a consumo (prezzi in USD)***
Limiti di frequenza**
1000 RPM (richieste al minuto)
2 milioni di TPM (token al minuto)
Prezzo (input)
0,35 $ / 1 milione di token (per prompt fino a 128.000 token)
0,70 $ / 1 milione di token (per prompt più lunghi di 128.000)
Memorizzazione nella cache contestuale (disponibile a breve)
Non applicabile
Prezzo (output)
1,05 $ / 1 milione di token (per prompt fino a 128.000 token)
2,10 $ / 1 milione di token (per prompt più lunghi di 128.000)
Prompt/risposte utilizzati per migliorare i nostri prodotti
Il nostro modello di nuova generazione con una finestra di contesto innovativa da 1 milione di persone. Ora in disponibilità generale per l'uso in produzione.
Senza costi*
Limiti di frequenza**
2 RPM (richieste al minuto)
32.000 TPM (token al minuto)
50 RPD (richieste al giorno)
Prezzo (input)
Senza costi
Memorizzazione nella cache contestuale (disponibile a breve)
Non applicabile
Prezzo (output)
Senza costi
Prompt/risposte utilizzati per migliorare i nostri prodotti
Pagamento a consumo (prezzi in USD)***
Limiti di frequenza**
360 RPM (richieste al minuto)
2 milioni di TPM (token al minuto)
10.000 RPD (richieste al giorno)
Prezzo (input)
3,50 $ / 1 milione di token (per prompt fino a 128.000 token)
7,00 $ / 1 milione di token (per prompt più lunghi di 128.000 $)
Memorizzazione nella cache contestuale (disponibile a breve)
1,75 $ / 1 milione di token (per prompt fino a 128.000 token)
3,50 $ / 1 milione di token (per prompt più lunghi di 128.000)
4,50 $ / 1 milione di token all'ora (spazio di archiviazione)
Prezzo (output)
10,50 $ / 1 milione di token (per prompt fino a 128.000 token)
21,00 $ / 1 milione di token (per prompt più lunghi di 128.000)
Prompt/risposte utilizzati per migliorare i nostri prodotti
Il nostro modello di prima generazione che offre solo ragionamento per testo e immagini. In disponibilità generale per l'uso in produzione.
Senza costi*
Limiti di frequenza**
15 RPM (richieste al minuto)
32.000 TPM (token al minuto)
1500 RPD (richieste al giorno)
Prezzo (input)
Senza costi
Memorizzazione nella cache contestuale (disponibile a breve)
Non applicabile
Prezzo (output)
Senza costi
Prompt/risposte utilizzati per migliorare i nostri prodotti
Pagamento a consumo (prezzi in USD)***
Limiti di frequenza**
360 RPM (richieste al minuto)
120.000 TPM (token al minuto)
30.000 RPD (richieste al giorno)
Prezzo (input)
$0,50 / 1 milione di token
Memorizzazione nella cache contestuale (disponibile a breve)
Non disponibile
Prezzo (output)
$1,50 / 1 milione di token
Prompt/risposte utilizzati per migliorare i nostri prodotti
*Le limitazioni di utilizzo del livello senza costi dell'API Gemini si applicano a SEE (inclusa l'UE), Regno Unito e Svizzera. Consulta le Domande frequenti sulla fatturazione per i dettagli.
**I limiti di frequenza specificati non sono garantiti e la capacità effettiva può variare. Richiedi un aumento del limite di frequenza massimo (solo per il livello a pagamento).
***I costi di inferenza dei modelli ottimizzati vengono fatturati allo stesso prezzo dei modelli di base. Per ricevere aiuto con la fatturazione, consulta Assistenza per la fatturazione Cloud.
****I prezzi possono variare rispetto ai prezzi qui elencati e ai prezzi offerti su Vertex AI. Per i prezzi di Vertex, consulta la documentazione di Vertex.
Crea con Vertex AI su Google Cloud