Sie haben die Next '24 verpasst? Alle Sitzungen sind jetzt on demand verfügbar. Jetzt ansehen

Integrierte Supercomputing-Architektur

KI-Hypercomputer

KI-optimierte Hardware, Software und Nutzung, für höhere Produktivität und Effizienz kombiniert.

Schnelltest zur KI-Bereitschaft durchführen

Blog: Cloud TPUv5 und KI Hypercomputer angekündigt

Überblick

Leistungsoptimierte Hardware

Unsere leistungsoptimierte Infrastruktur, die Google Cloud TPU, Google Cloud GPU, Google Cloud Storage und das zugrunde liegende Jupiter-Netzwerk umfasst, ermöglicht aufgrund der starken Skalierungsmerkmale der Architektur eine optimal kurze Zeit für das Training umfangreicher, hochmoderner Modelle, was zum besten Preis-Leistungs-Verhältnis für die Bereitstellung großer Modelle führt.

LLMs mit Google Cloud TPU optimieren

Hier erfahren Sie, wie der speziell von Google Cloud entwickelte AI Accelerator – Google Cloud TPU – die Leistung Ihrer LLM-Arbeitslasten optimiert.

On demand ansehen

Software öffnen

Unsere Architektur ist so optimiert, dass gängige Tools und Bibliotheken wie Tensorflow, Pytorch und JAX unterstützt werden. Außerdem können Kunden damit Technologien wie Cloud TPU-Multislice- und Multihost-Konfigurationen und verwaltete Dienste wie Google Kubernetes Engine nutzen. Kunden können so gängige Arbeitslasten wie das von SLURM orchestriert NVIDIA NeMO-Framework sofort bereitstellen.

LLMs auf GKE-Llama 2 und höher öffnen

Hier erfahren Sie, wie Sie Ihr Gem Ai-Plattformspiel mit Open LLMs auf GKE-Llama 2 und höher noch weiter optimieren können.

On demand ansehen

Flexibler Verbrauch

Mit unseren flexiblen Nutzungsmodellen können Kunden feste Kosten mit Rabatten für zugesicherte Nutzung oder dynamischen On-Demand-Modellen auswählen, um ihre Geschäftsanforderungen zu erfüllen.Der dynamische Arbeitslastplaner hilft Kunden, die von ihnen benötigte Kapazität ohne Überhang zu erhalten. So zahlen sie nur für das, was sie tatsächlich benötigen.Außerdem helfen die Tools zur Kostenoptimierung von Google Cloud bei der Automatisierung der Ressourcennutzung, um manuelle Aufgaben zu reduzieren, die von Entwicklern ausgeführt werden müssten.

Ressourcenzugriff und Wirtschaftlichkeit für KI-/ML-Arbeitslasten optimieren

Hier erfahren Sie, wie der dynamische Workload Scheduler die Ausführung Ihrer KI-Arbeitslast optimiert.

Blog lesen

Funktionsweise

Google ist dank der Erfindung von Technologien wie TensorFlow im Bereich künstliche Intelligenz führend. Wussten Sie, dass Sie die Technologie von Google auch für Ihre eigenen Projekte nutzen können? Erfahren Sie mehr über die Innovationsgeschichte von Google im Bereich der KI-Infrastruktur und wie Sie diese für Ihre Arbeitslasten nutzen können.

On demand ansehen

Gängige Einsatzmöglichkeiten

Umfangreiches KI-Training ausführen

Leistungsstarkes, skalierbares und effizientes KI-Training

Das Cloud TPU-Multislice-Training ist eine Full-Stack-Technologie, die ein schnelles, einfaches und zuverlässiges Training großer KI-Modelle mit Zehntausenden TPU-Chips ermöglicht.

Wie Sie KI-Training mit Multislice auf bis zu Zehntausende Cloud TPU-Chips skalieren

Trainingsgeschwindigkeit TPUv4(bf16) vs. TPUv5(int8)

KI-Training auf bis zu Zehntausende Cloud TPU-Chips skalieren

Weitere Ressourcen

Leistungsstarkes, skalierbares und effizientes KI-Training

Das Cloud TPU-Multislice-Training ist eine Full-Stack-Technologie, die ein schnelles, einfaches und zuverlässiges Training großer KI-Modelle mit Zehntausenden TPU-Chips ermöglicht.

Wie Sie KI-Training mit Multislice auf bis zu Zehntausende Cloud TPU-Chips skalieren

KI-Training auf bis zu Zehntausende Cloud TPU-Chips skalieren

Kundenbeispiele

Character AI nutzt Google Cloud, um hochzuskalieren

„Wir benötigen GPUs, um Antworten auf Nutzernachrichten zu generieren. Und je mehr Nutzer unsere Plattform hat, desto mehr GPUs benötigen wir, um unsere Dienste zu erbringen. In Google Cloud können wir experimentieren, um die richtige Plattform für eine bestimmte Arbeitslast zu finden. Es ist toll, die Flexibilität zu haben, die Lösungen auszuwählen, die am Besten sind.“ Myle Ott, Gründeringenieur, Character.AI

Jetzt ansehen

Myle Ott, Gründeringenieur, Character.AI

1:36

KI-gestützte Anwendungen bereitstellen

Offene Frameworks für KI-gestützte Umgebungen nutzen

Mit der offenen Softwareumgebung von Google Cloud können Sie Anwendungen mit den Tools und Frameworks erstellen, mit denen Sie sich am besten auskennen. Gleichzeitig profitieren Sie von den Preis-Leistungs-Vorteilen der KI-Hypercomputerarchitektur.

KI-Tools und -Frameworks von Google Cloud

KI in vollständig verwalteter GKE ausführen

Weitere Ressourcen

Offene Frameworks für KI-gestützte Umgebungen nutzen

Mit der offenen Softwareumgebung von Google Cloud können Sie Anwendungen mit den Tools und Frameworks erstellen, mit denen Sie sich am besten auskennen. Gleichzeitig profitieren Sie von den Preis-Leistungs-Vorteilen der KI-Hypercomputerarchitektur.

KI in vollständig verwalteter GKE ausführen

Kundenbeispiele

Priceline: Einzigartige Erlebnisse für Reisende

„Durch die Zusammenarbeit mit Google Cloud und das Einbinden von generativer KI können wir einen maßgeschneiderten Reise-Concierge als Teils unseres Chatbots anbieten. Wir möchten, dass alle Personen, die unseren Service nutzen, nicht einfach nur eine Reise planen, sondern ihr ganz persönliches und einzigartiges Reiseerlebnis gestalten können.“ Martin Brodbeck, CTO, Priceline

Weitere Informationen

Modelle kosteneffizient in großem Maßstab bereitstellen

Maximales Preis-Leistungs-Verhältnis für die Bereitstellung von KI in großem Maßstab

Cloud TPU v5e- und G2-VM-Instanzen mit NVIDIA L4-GPUs ermöglichen leistungsstarke und kostengünstige Inferenzen für eine breite Palette an KI-Arbeitslasten, einschließlich der neuesten LLMs und Gen AI-Modelle. Beide bieten erhebliche Preisleistungsverbesserungen im Vergleich zu früheren Modellen. Mit der KI-Hypercomputerarchitektur von Google Cloud können Kunden ihre Bereitstellungen auf branchenführende Levels skalieren.

Relative Leistung pro Dollar: Cloud TPU v4 und v5e

Cloud TPU v5e beschleunigt umfangreiche KI-Inferenzen

Weitere Ressourcen

Maximales Preis-Leistungs-Verhältnis für die Bereitstellung von KI in großem Maßstab

Cloud TPU v5e- und G2-VM-Instanzen mit NVIDIA L4-GPUs ermöglichen leistungsstarke und kostengünstige Inferenzen für eine breite Palette an KI-Arbeitslasten, einschließlich der neuesten LLMs und Gen AI-Modelle. Beide bieten erhebliche Preisleistungsverbesserungen im Vergleich zu früheren Modellen. Mit der KI-Hypercomputerarchitektur von Google Cloud können Kunden ihre Bereitstellungen auf branchenführende Levels skalieren.

Cloud TPU v5e beschleunigt umfangreiche KI-Inferenzen

Kundenbeispiele

Assembly AI nutzt Google Cloud für mehr Kosteneffizienz

„Unsere Testergebnisse zeigen, dass Cloud TPU v5e der kostengünstigste Beschleuniger für umfangreiche Inferenzen für unser Modell ist. Geboten wird eine 2,7-mal höhere Leistung pro Dollar als bei G2- und eine 4,2-mal höhere Leistung pro Dollar als bei A2-Instanzen.“ Domenic Donato

Vice President Technology, AssemblyAI

Weitere Informationen

Writer stellt KI-Lösungen effizient auf der Google Cloud GPU bereit

Open-Source-Modelle in Google Cloud

Integrierte Supercomputing-Architektur

KI-Hypercomputer

Führend im Bereich KI

Leistungsoptimierte Hardware

Software öffnen

Flexibler Verbrauch

Umfangreiches KI-Training ausführen

Leistungsstarkes, skalierbares und effizientes KI-Training

Character AI nutzt Google Cloud, um hochzuskalieren

Weitere Ressourcen

Leistungsstarkes, skalierbares und effizientes KI-Training

Kundenbeispiele

Character AI nutzt Google Cloud, um hochzuskalieren

KI-gestützte Anwendungen bereitstellen

Offene Frameworks für KI-gestützte Umgebungen nutzen

Priceline: Einzigartige Erlebnisse für Reisende

Weitere Ressourcen

Offene Frameworks für KI-gestützte Umgebungen nutzen

Kundenbeispiele

Priceline: Einzigartige Erlebnisse für Reisende

Modelle kosteneffizient in großem Maßstab bereitstellen

Maximales Preis-Leistungs-Verhältnis für die Bereitstellung von KI in großem Maßstab

Assembly AI nutzt Google Cloud für mehr Kosteneffizienz

Weitere Ressourcen

Maximales Preis-Leistungs-Verhältnis für die Bereitstellung von KI in großem Maßstab

Kundenbeispiele

Assembly AI nutzt Google Cloud für mehr Kosteneffizienz

Open-Source-Modelle in Google Cloud

Modell mit GKE auf einer einzelnen GPU bereitstellen

Gängige Modelle mit GPUs trainieren

Bereitstellung von Modellen für mehrere GPUs skalieren

LLM mithilfe von mehrere Hosts in GKE mit Saxml bereitstellen

Mit dem NVIDIA Nemo-Framework in großem Maßstab trainieren