Für mehr Beobachtbarkeit in Ihrer Infrastruktur und Ihren Anwendungen sorgen

Last reviewed 2023-08-21 UTC

Dieses Dokument im Google Cloud-Architektur-Framework enthält Best Practices, mit denen Sie Ihre Dienste beobachtbar machen können, um die Leistung Ihres Dienstes besser zu verstehen und Probleme schnell zu identifizieren. Die Beobachtbarkeit umfasst Monitoring, Logging, Tracing, Profiling, Debugging und ähnliche Systeme.

Monitoring bildet die Basis der Dienstzuverlässigkeitshierarchie im Google-SRE-Handbuch. Ohne ein ordnungsgemäßes Monitoring können Sie nicht feststellen, ob eine Anwendung ordnungsgemäß funktioniert.

Instrumentieren Sie Ihren Code, um die Beobachtbarkeit zu maximieren.

Ein gut durchdachtes System zielt darauf ab, das richtige Maß an Beobachtbarkeit zu erhalten, die in der Entwicklungsphase beginnt. Warten Sie nicht, bis sich eine Anwendung in der Produktion befindet, bevor Sie anfangen, sie zu beobachten. Instrumentieren Sie Ihren Code und beachten Sie die folgenden Richtlinien:

  • Für eine effiziente Fehlerbehebung müssen Sie überlegen, welche Log- und Trace-Einträge geschrieben werden sollen und welche Messwerte überwacht und exportiert werden sollen. Priorisieren Sie nach den wahrscheinlichsten oder häufigsten Fehlermodi des Systems.
  • Prüfen und bereinigen Sie Ihr Monitoringsystem regelmäßig. Löschen Sie nicht verwendete oder nutzlose Dashboards, Grafiken, Benachrichtigungen, Tracing- und Logging-Daten, um überflüssige Daten zu entfernen.

Google Cloud Observability bietet Echtzeit-Monitoring, Hybrid-Multi-Cloud-Monitoring und -Logging (z. B. für AWS und Azure) sowie Tracing, Profilerstellung und Debugging. Google Cloud Observability kann auch Mikrodienste automatisch erkennen und überwachen, die in App Engine oder in einem Service Mesh wie Istio ausgeführt werden.

Wenn Sie viele Anwendungsdaten generieren, können Sie die umfassende Aufnahme von Analyseereignislogs mit BigQuery optimieren. BigQuery eignet sich auch zum Speichern und Analysieren von Zeitachsendaten mit hoher Kardinalität aus Ihrem Monitoring-Framework. Dieser Ansatz ist nützlich, da Sie damit beliebige Abfragen zu geringeren Kosten ausführen können, statt das Monitoring von Anfang an perfekt zu planen, und die Berichterstellung vom Monitoring entkoppelt wird. Sie können aus den Daten Berichte mit Looker Studio oder Looker erstellen.

Empfehlungen

Befolgen Sie diese Empfehlungen, um die Anleitung im Architektur-Framework auf Ihre eigene Umgebung anzuwenden:

  • Implementieren Sie das Monitoringsystem frühzeitig, z. B. bevor Sie eine Migration starten oder bevor Sie eine neue Anwendung in einer Produktionsumgebung bereitstellen.
  • Unterscheiden Sie zwischen Anwendungsproblemen und zugrunde liegenden Cloud-Problemen. Verwenden Sie die Monitoring API oder andere Cloud Monitoring-Produkte und das Google Cloud Status-Dashboard.
  • Definieren Sie neben dem Monitoring eine Strategie für Beobachtbarkeit, die Tracing, Profiling und Debugging umfasst.
  • Bereinigen Sie regelmäßig Beobachtbarkeitsartefakte, die Sie nicht verwenden oder keinen Wert bieten, z. B. nicht umsetzbare Benachrichtigungen.
  • Wenn Sie große Mengen an Beobachtbarkeitsdaten generieren, senden Sie Anwendungsereignisse an ein Data-Warehouse-System wie BigQuery.

Nächste Schritte

Weitere Kategorien im Architektur-Framework kennenlernen, z. B. Systemdesign, operative Exzellenz sowie Sicherheit, Datenschutz und Compliance