Imagen für die visuelle Untertitelung und das VQA (Visual Question Answering) von Vertex AI verwenden, um Bildinformationen abzurufen (Console)
Erfahren Sie, wie Sie mit Imagen in den Vertex AI-Features für die visuelle Untertitelung und dem VQA (Visual Question Answering) von Vertex AI Textinformationen zu einem Bild abrufen. In dieser Kurzanleitung erfahren Sie, wie Sie in der Google Cloud Console die visuelle Untertitelung und VQA verwenden.
Hinweise
- Melden Sie sich bei Ihrem Google Cloud-Konto an. Wenn Sie mit Google Cloud noch nicht vertraut sind, erstellen Sie ein Konto, um die Leistungsfähigkeit unserer Produkte in der Praxis sehen und bewerten zu können. Neukunden erhalten außerdem ein Guthaben von 300 $, um Arbeitslasten auszuführen, zu testen und bereitzustellen.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Die Abrechnung für das Google Cloud-Projekt muss aktiviert sein.
-
Vertex AI API aktivieren.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Die Abrechnung für das Google Cloud-Projekt muss aktiviert sein.
-
Vertex AI API aktivieren.
Beispielbild abrufen
Nachdem Sie Ihre Umgebung eingerichtet haben, können Sie ein Beispielbild abrufen und die visuelle Untertitelung und das Visual Question Answering verwenden, um Informationen zum Bild zu erhalten.
Um das Beispiel-Image abzurufen, laden Sie das Image entweder direkt aus Cloud Storage herunter oder speichern es mit dem folgenden Befehl im aktuellen Verzeichnis:
curl -O https://storage.googleapis.com/cloud-samples-data/generative-ai/image/vcap-vqa-quickstart_fish.jpg
Bildbeschreibungen mit der visuellen Untertitelung erstellen
Nachdem Sie das Beispielbild abgerufen haben, können Sie eine Anfrage zur visuellen Untertitelung senden, um eine Textbeschreibung des Bildes zu erhalten.
Console
Öffnen Sie in der Google Cloud Console den Tab Vertex AI Studio > Vision im Vertex AI-Dashboard.
Klicken Sie im unteren Menü auf
Untertitel.Klicken Sie auf Bild hochladen und wählen Sie das lokale Bild zur Untertitelung aus.
Legen Sie im Bereich Parameters Folgendes fest:
- Anzahl der Untertitel: Wählen Sie
2
aus. - Sprache: Wählen Sie
English (en)
aus, falls nicht bereits ausgewählt.
- Anzahl der Untertitel: Wählen Sie
Klicken Sie auf
Untertitel generieren.
Antworten auf Fragen mit VQA generieren
Weiter können Sie dasselbe Bild verwenden, um eine Frage zum Bild zu stellen und eine Antwort mit der VQA-Funktion zu erhalten.
Console
Öffnen Sie in der Google Cloud Console den Tab Vertex AI Studio > Vision im Vertex AI-Dashboard.
Klicken Sie im unteren Menü auf
Visuelles Q & A.Klicken Sie auf Bild hochladen und wählen Sie das lokale Bild aus.
Wählen Sie im Bereich Parameters als Anzahl an Antworten den Wert 2 aus.
Geben Sie in das Prompt-Feld (Frage stellen) folgenden Text ein:
What color is the left fish?
Klicken Sie auf
Erstellen.
Glückwunsch! Sie haben gerade die visuelle Untertitelung und die VQA-Features von Imagen verwendet, um Informationen zu einem Bild abzurufen.
Bereinigen
Mit den folgenden Schritten vermeiden Sie, dass Ihrem Google Cloud-Konto die in dieser Anleitung verwendeten Ressourcen in Rechnung gestellt werden:
Projekt löschen
- Wechseln Sie in der Google Cloud Console zur Seite Ressourcen verwalten.
- Wählen Sie in der Projektliste das Projekt aus, das Sie löschen möchten, und klicken Sie dann auf Löschen.
- Geben Sie im Dialogfeld die Projekt-ID ein und klicken Sie auf Shut down (Beenden), um das Projekt zu löschen.
Nächste Schritte
- Lesen Sie die Nutzungsrichtlinien für Imagen in Vertex AI
- Vortrainierte Modelle in Model Garden untersuchen.
- Verantwortungsbewusste Best Practices für KI und die Sicherheitsfilter von Vertex AI