Disesuaikan dengan biaya untuk membantu Anda menghadirkan aplikasi ke dunia
Tersedia sekarang
Tersedia sekarang
Tersedia sekarang
Model multimodal tercepat kami dengan performa luar biasa untuk tugas yang beragam dan berulang serta periode konteks dalam 1 juta. Kini tersedia secara umum untuk penggunaan produksi.
Tanpa biaya*
Batas Kapasitas**
15 RPM (permintaan per menit)
1 juta TPM (token per menit)
1.500 RPD (permintaan per hari)
Harga (input)
Tanpa biaya
Penyimpanan konteks dalam cache - segera hadir
Tidak berlaku
Harga (output)
Tanpa biaya
Perintah/respons yang digunakan untuk meningkatkan kualitas produk kami
Bayar sesuai penggunaan (harga dalam USD)***
Batas Kapasitas**
1.000 RPM (permintaan per menit)
2 juta TPM (token per menit)
Harga (input)
$0,35 / 1 juta token (untuk prompt hingga 128 ribu token)
$0,70 / 1 juta token (untuk perintah yang lebih lama dari 128 ribu)
Penyimpanan konteks dalam cache - segera hadir
Tidak berlaku
Harga (output)
$1,05 / 1 juta token (untuk prompt hingga 128 ribu token)
$2,10 / 1 juta token (untuk permintaan yang lebih lama dari 128 ribu)
Perintah/respons yang digunakan untuk meningkatkan kualitas produk kami
Tidak
Model generasi berikutnya dengan terobosan jendela konteks 1 juta. Kini tersedia secara umum untuk penggunaan produksi.
Tanpa biaya*
Batas Kapasitas**
2 RPM (permintaan per menit)
32.000 TPM (token per menit)
50 RPD (permintaan per hari)
Harga (input)
Tanpa biaya
Penyimpanan konteks dalam cache - segera hadir
Tidak berlaku
Harga (output)
Tanpa biaya
Perintah/respons yang digunakan untuk meningkatkan kualitas produk kami
Bayar sesuai penggunaan (harga dalam USD)***
Batas Kapasitas**
360 RPM (permintaan per menit)
2 juta TPM (token per menit)
10.000 RPD (permintaan per hari)
Harga (input)
$3,50 / 1 juta token (untuk prompt hingga 128 ribu token)
$7,00 / 1 juta token (untuk permintaan yang lebih lama dari 128 ribu)
Penyimpanan konteks dalam cache - segera hadir
$1,75 / 1 juta token (untuk prompt hingga 128 ribu token)
$3,50 / 1 juta token (untuk permintaan yang lebih lama dari 128 ribu)
$4,50 / 1 juta token per jam (penyimpanan)
Harga (output)
$10,50 / 1 juta token (untuk prompt hingga 128 ribu token)
$21,00 / 1 juta token (untuk permintaan yang lebih lama dari 128 ribu)
Perintah/respons yang digunakan untuk meningkatkan kualitas produk kami
Tidak
Model generasi pertama kami hanya menawarkan penalaran teks dan gambar. Tersedia secara umum untuk penggunaan produksi.
Tanpa biaya*
Batas Kapasitas**
15 RPM (permintaan per menit)
32.000 TPM (token per menit)
1.500 RPD (permintaan per hari)
Harga (input)
Tanpa biaya
Penyimpanan konteks dalam cache - segera hadir
Tidak berlaku
Harga (output)
Tanpa biaya
Perintah/respons yang digunakan untuk meningkatkan kualitas produk kami
Bayar sesuai penggunaan (harga dalam USD)***
Batas Kapasitas**
360 RPM (permintaan per menit)
120.000 TPM (token per menit)
30.000 RPD (permintaan per hari)
Harga (input)
$0,50 / 1 juta token
Penyimpanan konteks dalam cache - segera hadir
Tidak tersedia
Harga (output)
$1,50 / 1 juta token
Perintah/respons yang digunakan untuk meningkatkan kualitas produk kami
Tidak
*Pembatasan penggunaan paket gratis Gemini API berlaku untuk EEA (termasuk Uni Eropa), Inggris Raya, dan Swiss. Lihat FAQ Penagihan untuk mengetahui detailnya.
**Batas kapasitas yang ditentukan tidak dijamin dan kapasitas sebenarnya mungkin berbeda. Ajukan permohonan untuk menaikkan batas kapasitas maksimum (khusus paket berbayar).
***Biaya inferensi model yang disesuaikan ditagih dengan harga yang sama dengan model dasar. Untuk mendapatkan bantuan terkait penagihan, lihat Dukungan Penagihan Cloud.
****Harga dapat berbeda dari harga yang tercantum di sini dan harga yang ditawarkan di Vertex AI. Untuk harga Vertex, lihat dokumentasi Vertex.
Membangun solusi dengan Vertex AI di Google Cloud