Kapazitäten und Kontingente verwalten

Last reviewed 2023-08-21 UTC

Dieses Dokument im Google Cloud Architecture Framework zeigt Ihnen, wie Sie Ihre Kapazität und Ihr Kontingent in der Cloud bewerten und planen können.

In herkömmlichen Rechenzentren müssen Sie in der Regel mehrmals pro Quartal den aktuellen Ressourcenbedarf prüfen und den bevorstehenden Bedarf schätzen. Sie müssen physische, logistische und personelle Aspekte berücksichtigen. Elemente wie Rackfläche, Kühlung, Stromversorgung, Bandbreite, Verkabelung, Beschaffungszeiten, Lieferzeiten und die Anzahl der zur Arbeit mit neuer Ausrüstung verfügbaren Ingenieure sind zu berücksichtigen. Sie müssen weiter die Verteilung von Kapazitäten und Arbeitslasten aktiv verwalten, damit ressourcenintensive Jobs, darunter Hadoop-Pipelines, nicht Dienste wie Webserver beeinträchtigen, die hochverfügbar sein müssen.

Im Gegensatz dazu übergeben Sie bei der Nutzung von Google Cloud die meisten Kapazitätsplanungen an Google. Wenn Sie die Cloud nutzen, müssen Sie inaktive Ressourcen nicht bereitstellen und verwalten, wenn diese nicht benötigt werden. Beispiel: Sie können VM-Instanzen nach Bedarf erstellen oder hoch- und herunterskalieren. Da Sie nur für die tatsächliche Nutzung zahlen, können Sie Ihre Ausgaben optimieren, einschließlich überschüssiger Kapazität, die Sie nur zu Spitzenzeiten benötigen. Um Sie bei Ihren Einsparungen zu unterstützen, stellt Compute Engine Empfehlungen für Maschinentypen bereit, sobald nicht ausgelastete VM-Instanzen erfasst werden, deren Größe angepasst oder die gelöscht werden können.

Cloud-Kapazitätsanforderungen bewerten

Um Ihre Kapazitäten effizient verwalten zu können, müssen Sie die Kapazitätsanforderungen Ihrer Organisation kennen.

Um Ihre Kapazitätsanforderungen zu bewerten, ermitteln Sie zuerst Ihre wichtigsten Cloud-Arbeitslasten. Bestimmen Sie die durchschnittliche und maximale Auslastung dieser Arbeitslasten sowie deren aktuellen und zukünftigen Kapazitätsanforderungen.

Identifizieren Sie die Teams, die diese Top-Arbeitslasten verwenden. Arbeiten Sie mit ihnen zusammen, um einen internen Bedarfsplanungsprozess einzurichten. Verwenden Sie diesen Prozess, um seine aktuellen und prognostizierten Cloud-Ressourcenanforderungen zu verstehen.

Analysieren Sie Lademuster und Aufrufverteilung. Nutzen Sie in Ihrer Analyse Faktoren wie den Spitzenwert der letzten 30 Tage, den stündlichen Spitzenwert und den Spitzenwert pro Minute.

Sie können Cloud Monitoring nutzen, um Einblicke in die Leistung, die Verfügbarkeit und den Gesamtzustand von Anwendungen und Infrastruktur zu erhalten.

Messwerte zur Infrastrukturauslastung ansehen

Erfassen und speichern Sie Verlaufsdaten zur Nutzung von Cloud-Ressourcen in Ihrer Organisation, um die Kapazitätsplanung zu vereinfachen.

Verschaffen Sie sich einen Überblick über Messwerte zur Infrastrukturauslastung. Prüfen Sie für wichtige Arbeitslasten beispielsweise:

  • Durchschnittliche und maximale Auslastung
  • Spitzen bei Nutzungsmustern
  • Saisonale Spitzen basierend auf Geschäftsanforderungen, z. B. an Feiertagen (für Einzelhändler)
  • Wie viel Überdimensionierung ist erforderlich, um auf Spitzenereignisse vorzubereitet zu sein und potenzielle Trafficspitzen schnell ansprechen zu können

Achten Sie darauf, dass Ihre Organisation Warnungen eingerichtet hat, die Sie automatisch benachrichtigen, sobald Kontingent- und Kapazitätslimits erreicht sind.

Mit den Monitoring-Tools von Google erhalten Sie Informationen zur Anwendungsnutzung und -kapazität. Beispielsweise können Sie mit Monitoring benutzerdefinierte Messwerte definieren. Verwenden Sie diese benutzerdefinierten Messwerte, um Benachrichtigungstrends zu definieren. Monitoring bietet außerdem flexible Dashboards und umfangreiche Visualisierungstools, mit denen sich potenzielle Probleme rechtzeitig erkennen lassen.

Prozess für die Kapazitätsplanung erstellen

Legen Sie einen Prozess für die Kapazitätsplanung fest und dokumentieren Sie diesen Plan.

Gehen Sie beim Erstellen des Plans so vor:

  1. Führen Sie Lasttests durch, um festzustellen, wie viel Last das System unter Einhaltung der Latenzvorgaben bei einer festen Anzahl von Ressourcen bewältigen kann. Lasttests sollten eine Mischung aus Anfragetypen verwenden, die mit Produktions-Traffic-Profilen von Livenutzern übereinstimmen. Verwenden Sie keine einheitliche oder zufällige Mischung von Vorgängen. Beziehen Sie Nutzungsspitzen in Ihr Traffic-Profil ein.
  2. Erstellen Sie ein Kapazitätsmodell. Ein Kapazitätsmodell ist eine Reihe von Formeln zur Berechnung der zusätzlichen Ressourcen, die pro Einheitsanstieg der Dienstlast erforderlich sind, wie sie bei Lasttests ermittelt wurden.
  3. Prognostizieren Sie den zukünftigen Traffic und berücksichtigen Sie dabei eventuelles Wachstum. Eine Beschreibung der Erstellung von Trafficprognosen durch Google finden Sie im Artikel Messung der zukünftigen Last.
  4. Wenden Sie das Kapazitätsmodell auf die Prognose an, um den zukünftigen Ressourcenbedarf zu ermitteln.
  5. Schätzen Sie die Kosten für Ressourcen, die Ihre Organisation benötigt. Lassen Sie sich dann von Ihrer Finanzorganisation eine Budgetgenehmigung erteilen. Dieser Schritt ist wichtig, da das Unternehmen bei einer Reihe von Produkten einen Kompromiss zwischen Kosten und Risiko eingehen kann. Diese Kompromisse können dazu führen, dass aufgrund von geschäftlichen Prioritäten Kapazitäten erworben werden, die niedriger oder höher sind als der vorhergesagte Bedarf für ein bestimmtes Produkt.
  6. Wenden Sie sich an Ihren Cloud-Anbieter, um die erforderliche Anzahl an Ressourcen zur richtigen Zeit über Kontingente und Reservierungen zu erhalten. Beziehen Sie Infrastrukturteams in die Kapazitätsplanung ein und lassen Sie Betriebsabläufe mit Konfidenzintervallen erstellen.
  7. Wiederholen Sie die vorherigen Schritte alle ein bis zwei Quartale.

Eine ausführlichere Anleitung zur Kapazitätsplanung bei gleichzeitiger Optimierung der Ressourcennutzung finden Sie unter Kapazitätsplanung.

Kontingente an Ihre Kapazitätsanforderungen anpassen

Google Cloud verwendet Kontingente, um den Umfang einer bestimmten freigegebenen Google Cloud-Ressource einzuschränken. Jedes Kontingent stellt eine bestimmte zählbare Ressource dar, z. B. API-Aufrufe an einen bestimmten Dienst, die Anzahl der von Ihrem Projekt gleichzeitig verwendeten Load-Balancer oder die Anzahl der Projekte, die Sie erstellen können. Mit Kontingenten wird zum Beispiel verhindert, dass wenige Kunden oder Projekte CPU-Kerne in einer bestimmten Region oder Zone monopolisieren.

Beachten Sie beim Prüfen Ihres Kontingents folgende Details:

  • Sie sollten die Kapazitätsanforderungen Ihrer Projekte im Voraus planen, um unerwartete Einschränkungen bei der Ressourcennutzung zu vermeiden.
  • Legen Sie Ihr Kontingent und Ihre Kapazität so fest, dass ein Ausfall der gesamten Region abgefangen werden kann.
  • Verwenden Sie Kontingente, um die Nutzung einer bestimmten Ressource zu begrenzen. Sie können zum Beispiel ein Kontingent für die maximale Abfragenutzung pro Tag über die BigQuery API festlegen, damit ein Projekt nicht zu viel für BigQuery ausgibt.
  • Planen Sie Nutzungsspitzen und berücksichtigen Sie diese bei der Kontingentplanung. Spitzen bei der Nutzung können durch tägliche Schwankungen, unerwartete Traffic-Spitzen oder bekannte Spitzenlasten und Startereignisse geschätzt werden. Weitere Informationen zur Planung von Traffic-Spitzen und Startereignissen finden Sie im nächsten Abschnitt von Operative Exzellenz: Planen Sie Traffic-Spitzen und Startereignisse.

Wenn Ihre aktuellen Kontingente nicht ausreichen, können Sie Kontingente über die Cloud Console verwalten. Sollten Sie eine sehr große Kapazität benötigen, wenden Sie sich an Ihr Google Cloud-Vertriebsteam. Beachten Sie, dass viele Dienste Limits haben, die nicht mit dem Kontingentsystem in Zusammenhang stehen. Weitere Informationen finden Sie unter Mit Kontingenten arbeiten.

Prüfen Sie regelmäßig Ihre Kontingente. Senden Sie Kontingentanfragen, bevor sie benötigt werden. Weitere Informationen dazu, wie Kontingentanfragen evaluiert und wie Anfragen genehmigt oder abgelehnt werden, finden Sie unter Mit Kontingenten arbeiten.

Es gibt mehrere Möglichkeiten, Ihr Google Cloud-Kontingent aufzurufen und zu verwalten:

Nächste Schritte