Gemini

Gemini, geliştiricilerin içerik oluşturmasına ve sorunları çözmesine olanak tanıyan üretken yapay zeka modellerinden oluşan bir ailedir. Bu modeller, hem metin hem de resimleri giriş olarak işleyecek şekilde tasarlanmış ve eğitilmiştir. Bu kılavuzda, kullanım alanınıza en uygun varyantın hangisi olduğuna karar vermenize yardımcı olmak için her model varyantı hakkında bilgi verilmektedir.

Model varyantları

Gemini API, belirli kullanım alanları için optimize edilmiş farklı modeller sunar. Kullanabileceğiniz Gemini varyantlarına kısa bir genel bakış:

Model varyantı Girişler Çıkış Optimizasyon amacı
Gemini 1.5 Pro
gemini-1.5-pro
Ses, resim, video ve metin Metin Kod ve metin oluşturma, metin düzenleme, sorun çözme, veri ayıklama ve oluşturma gibi karmaşık akıl yürütme görevleri
Gemini 1.5 Flash
gemini-1.5-flash
Ses, resim, video ve metin Metin Çeşitli görevlerde hızlı ve çok yönlü performans
Gemini 1.0 Pro
gemini-1.0-pro
Metin Metin Doğal dil görevleri, çok dönüşlü metin ve kod sohbeti ve kod oluşturma
(Kullanımdan kaldırıldı) Gemini 1.0 Pro Vision
gemini-pro-vision
Resimler, videolar ve metinler Metin Görsel açıklamaları oluşturma veya resimlerdeki nesneleri tanımlama gibi görselle ilgili görevler
Metin Yerleştirme
text-embedding-004
Metin Metin yerleştirilmiş öğeler Metin dizelerinin alaka düzeyini ölçme

Aşağıdaki tabloda, tüm model varyantlarında ortak olan Gemini modellerinin özellikleri açıklanmaktadır:

Özellik Açıklama
Eğitim verileri Gemini'ın son bilgi tarihi Kasım 2023'tür. Bu süreden sonraki etkinlikler hakkında bilgi sınırlıdır.
Desteklenen diller Kullanılabilir dilleri görün
Yapılandırılabilir model parametreleri
  • Üst p
  • İlk k
  • Sıcaklık
  • Adım sırasını durdur
  • Maksimum çıkış uzunluğu
  • Yanıt adaylarının sayısı

Bu parametrelerin her biri hakkında bilgi edinmek için üretken modeller kılavuzunun model parametreleri bölümünü inceleyin.

Gemini 1.5 Pro

Gemini 1.5 Pro, aşağıdakiler gibi çok çeşitli akıl yürütme görevleri için optimize edilmiş orta boyutlu, çok modlu bir modeldir:

  • Kod oluşturma
  • Metin oluşturma
  • Metin düzenleme
  • Problem çözme
  • Öneri oluşturma
  • Bilgi ayıklama
  • Veri ayıklama veya oluşturma
  • AI aracılarının oluşturulması

1.5 Pro 1 saatlik video, 9,5 saatlik ses, 30.000'den fazla kod satırı veya 700.000'den fazla kelime içeren kod tabanları dahil büyük miktarda veriyi aynı anda işleyebilir.

1.5 Pro; sıfır, bir ve birkaç atışlık öğrenme görevlerini yerine getirebilir.

Model ayrıntıları

Özellik Açıklama
Model kodu models/gemini-1.5-pro-latest
Girişler Ses, resim, video ve metin
Çıkış Metin
Desteklenen oluşturma yöntemleri generateContent
Giriş jetonu sınırı[**] 1.048.576
Çıkış jetonu sınırı[**] 8.192
İstem başına maksimum resim sayısı 3.600
Maksimum video uzunluğu 1 saat
Maksimum ses uzunluğu Yaklaşık 9,5 saat
İstem başına maksimum ses dosyası sayısı 1
Model güvenliği Geliştiriciler tarafından düzenlenebilen otomatik olarak uygulanan güvenlik ayarları. Ayrıntılı bilgi için güvenlik ayarları sayfamıza bakın.
Oran sınırları[*]
Ücretsiz:
  • 2 devir/dk.
  • 32.000 TPM
  • 50 RPD
  • 46.080.000 TPD
Pay-as-you-go:
  • 360 devir/dk.
  • 2 milyon TPM
  • 10.000 RPD
  • 14.400.000.000 TPD
İki milyon içerik:
  • 1 devir/dk.
  • 2 milyon TPM
  • 50 RPD
Sistem talimatları Destekleniyor
JSON modu Destekleniyor
Son sürüm gemini-1.5-pro-latest
En son kararlı sürüm gemini-1.5-pro
Kararlı sürümler gemini-1.5-pro-001
Son güncelleme Mayıs 2024

Gemini 1.5 Flash

Gemini 1.5 Flash, çeşitli görevlerde ölçeklendirme için hızlı ve çok yönlü bir modeldir.

Model ayrıntıları

Özellik Açıklama
Model kodu gemini-1.5-flash-latest
Girişler Ses, resim, video ve metin
Çıkış Metin
Desteklenen oluşturma yöntemleri generateContent
Giriş jetonu sınırı[**] 1.048.576
Çıkış jetonu sınırı[**] 8.192
İstem başına maksimum resim sayısı 3.600
Maksimum video uzunluğu 1 saat
Maksimum ses uzunluğu Yaklaşık 9,5 saat
İstem başına maksimum ses dosyası sayısı 1
Model güvenliği Geliştiriciler tarafından düzenlenebilen otomatik olarak uygulanan güvenlik ayarları. Ayrıntılı bilgi için güvenlik ayarları sayfamıza bakın.
Oran sınırları[*]
Ücretsiz:
  • 15 devir/dk.
  • 1 milyon TPM
  • 1.500 RPD
Pay-as-you-go:
  • 1.000 devir/dk.
  • 2 milyon TPM
Sistem talimatları Destekleniyor
JSON modu Destekleniyor
Model ince ayarı Çok yakında
Son sürüm gemini-1.5-flash-latest
En son kararlı sürüm gemini-1.5-flash
Kararlı sürümler gemini-1.5-flash-001
Son güncelleme Mayıs 2024

Gemini 1.0 Pro

Gemini 1.0 Pro, çok dönüşlü metin, kodlu sohbet ve kod oluşturma gibi görevleri gerçekleştiren bir NLP modelidir.

1.0 Pro sıfır, bir ve birkaç atışlık öğrenme görevlerini yerine getirebilir.

Model ayrıntıları

Özellik Açıklama
Model kodu models/gemini-1.0-pro
Giriş Metin
Çıkış Metin
Desteklenen oluşturma yöntemleri
Python: generate_content
REST: generateContent
Oran sınırları[*]
Ücretsiz:
  • 15 devir/dk.
  • 32.000 TPM
  • 1.500 RPD
  • 46.080.000 TPD
Pay-as-you-go:
  • 360 devir/dk.
  • 120.000 TPM
  • 30.000 RPD
  • 172.800.000 TPD
Sistem talimatları Desteklenmiyor
JSON modu Desteklenmiyor
Model ince ayarı Destekleniyor: gemini-1.0-pro-001
Son sürüm gemini-1.0-pro-latest
En son kararlı sürüm gemini-1.0-pro
Kararlı sürümler gemini-1.0-pro-001
Son güncelleme Şubat 2024

(Kullanımdan kaldırıldı) Gemini 1.0 Pro Vision

Gemini 1.0 Pro Vision, görselle ilgili görevleri gerçekleştirebilen, performansı optimize edilmiş çok modlu bir modeldir. Örneğin, 1.0 Pro Vision; resim açıklamaları oluşturabilir, görüntülerdeki nesneleri tanımlayabilir, görüntülerdeki yerler veya nesneler hakkında bilgi verebilir ve daha fazlasını yapabilir.

1.0 Pro Vision; sıfır, bir veya birkaç atışlık görevleri gerçekleştirebilir.

Model ayrıntıları

Özellik Açıklama
Model kodu models/gemini-pro-vision
Girişler Metin, video ve resimler
Çıkış Metin
Desteklenen oluşturma yöntemleri
Python: generate_content
REST: generateContent
Giriş jetonu sınırı[*] 12.288
Çıkış jetonu sınırı[*] 4.096
Maksimum resim boyutu Sınır yok
İstem başına maksimum resim sayısı 16
Maksimum video uzunluğu 2 dakika
İstem başına maksimum video sayısı 1
Model güvenliği Geliştiriciler tarafından düzenlenebilen otomatik olarak uygulanan güvenlik ayarları. Ayrıntılı bilgi için güvenlik ayarları sayfamıza bakın.
Oran sınırı[*] Dakikada 60 istek
Son sürüm gemini-1.0-pro-vision-latest
En son kararlı sürüm gemini-1.0-pro-vision
Son güncelleme Aralık 2023

Metin Yerleştirme ve Yerleştirme

Metin Yerleştirme

Giriş metni için metin yerleştirmeler oluşturmak amacıyla Metin Yerleştirme modelini kullanabilirsiniz. Metin Yerleştirme modeli hakkında daha fazla bilgi edinmek için metin yerleştirme modeliyle ilgili Vertex AI'da üretken yapay zeka dokümanlarını inceleyin.

Metin Yerleştirme modeli,en fazla 2.048 jetonluk metinler için 768 boyutlu yerleştirmeler oluşturmak üzere optimize edilmiştir. Metin Yerleştirme, 768'in altında elastik yerleştirme boyutları sunar. Esnek yerleştirmeleri kullanarak daha küçük çıkış boyutları oluşturabilir ve küçük bir performans kaybıyla işlem ve depolama maliyetlerinden tasarruf edebilirsiniz.

Model ayrıntıları
Özellik Açıklama
Model kodu models/text-embedding-004 (Vertex AI'da text-embedding-preview-0409)
Giriş Metin
Çıkış Metin yerleştirilmiş öğeler
Giriş jetonu sınırı 2.048
Çıkış boyutu boyutu 768
Desteklenen oluşturma yöntemleri
Python: embed_content
REST: embedContent
Model güvenliği Ayarlanabilir güvenlik ayarı yoktur.
Oran sınırı[*] Dakikada 1.500 istek
Son güncelleme Nisan 2024

Yerleştirme

Giriş metni için metin yerleştirmeler oluşturmak amacıyla Yerleştirme modelini kullanabilirsiniz.

Yerleştirme modeli,en fazla 2.048 jetonluk metinler için 768 boyutlu yerleştirmeler oluşturmak üzere optimize edilmiştir.

Model ayrıntıları yerleştirme
Özellik Açıklama
Model kodu models/embedding-001
Giriş Metin
Çıkış Metin yerleştirilmiş öğeler
Giriş jetonu sınırı 2.048
Çıkış boyutu boyutu 768
Desteklenen oluşturma yöntemleri
Python: embed_content
REST: embedContent
Model güvenliği Ayarlanabilir güvenlik ayarı yoktur.
Oran sınırı[*] Dakikada 1.500 istek
Son güncelleme Aralık 2023

HKİ

AQA modelini bir belge, topluluk veya pasaj kümesi üzerinde İlişkilendirilmiş Soru Cevaplama (AQA) ile ilgili görevleri gerçekleştirmek için kullanabilirsiniz. AQA modeli, yanıtlanabilir olasılık tahminiyle birlikte, sağlanan kaynaklara dayanan soruların yanıtlarını döndürür.

Model ayrıntıları

Özellik Açıklama
Model kodu models/aqa
Giriş Metin
Çıkış Metin
Desteklenen oluşturma yöntemleri
Python: GenerateAnswerRequest
REST: generateAnswer
Desteklenen diller İngilizce
Giriş jetonu sınırı[**] 7.168
Çıkış jetonu sınırı[**] 1.024
Model güvenliği Geliştiriciler tarafından düzenlenebilen otomatik olarak uygulanan güvenlik ayarları. Ayrıntılı bilgi için güvenlik ayarları sayfamıza bakın.
Oran sınırı[*] Dakikada 60 istek
Son güncelleme Aralık 2023

Bu model varyantlarının özelliklerini keşfetmek için örneklere bakın.

[*] Jeton, Gemini modellerinde yaklaşık 4 karaktere eşdeğerdir. 100 jeton, yaklaşık 60-80 İngilizce kelimedir.

[**] BGBG: Dakika başına istek sayısı
TPM: Dakika başına jeton sayısı
RPD: Günlük istek sayısı
TPD: Günlük jeton sayısı

Kapasite sınırlamaları nedeniyle, belirtilen maksimum hız sınırları garanti edilmez.

Model sürümü adı kalıpları

Gemini modelleri, önizleme veya kararlı sürümlerde mevcuttur. Kodunuzda, kullanmak istediğiniz modeli ve sürümü belirtmek için aşağıdaki model adı biçimlerinden birini kullanabilirsiniz.

  • En yeni: Belirli bir nesil ve varyasyon için modelin en son sürümüne yönlendirir. Temel model düzenli olarak güncellenir ve önizleme sürümü olabilir. Bu takma adı yalnızca keşif amaçlı test uygulamaları ve prototipler kullanmalıdır.

    En son sürümü belirtmek için şu kalıbı kullanın: <model>-<generation>-<variation>-latest. Örneğin, gemini-1.0-pro-latest.

  • En son kararlı: Belirtilen model oluşturma ve varyasyon için yayınlanan en son kararlı sürüme işaret eder.

    En son kararlı sürümü belirtmek için aşağıdaki kalıbı kullanın: <model>-<generation>-<variation>. Örneğin, gemini-1.0-pro.

  • Kararlı: Belirli bir kararlı modele işaret eder. Kararlı modeller değişmez. Çoğu üretim uygulaması belirli bir kararlı modeli kullanmalıdır.

    Kararlı bir sürüm belirtmek için şu kalıbı kullanın: <model>-<generation>-<variation>-<version>. Örneğin, gemini-1.0-pro-001.

Mevcut diller

Gemini modelleri aşağıdaki dillerde çalışacak şekilde eğitilir:

  • Arapça (ar)
  • Bengalce (bn)
  • Bulgarca (bg)
  • Çince (Basitleştirilmiş ve geleneksel) (zh)
  • Hırvatça (hr)
  • Çekçe (cs)
  • Danca (da)
  • Felemenkçe (nl)
  • İngilizce (en),
  • Estonca (et)
  • Fince (fi)
  • Fransızca (fr)
  • Almanca (de)
  • Yunanca (el)
  • İbranice (iw)
  • Hintçe (hi)
  • Macarca (hu)
  • Endonezce (id)
  • İtalyanca (it)
  • Japonca (ja)
  • Korece (ko)
  • Letonca (lv),
  • Litvanca (lt)
  • Norveççe (no)
  • Lehçe (pl)
  • Portekizce (pt)
  • Rumence (ro)
  • Rusça (ru)
  • Sırpça (sr)
  • Slovakça (sk)
  • Slovence (sl)
  • İspanyolca (es)
  • Svahili (sw)
  • İsveççe (sv)
  • Tayca (th)
  • Türkçe (tr)
  • Ukraynaca (uk)
  • Vietnamca (vi)