Administra la capacidad y la cuota

Last reviewed 2023-08-21 UTC

En este documento del framework de arquitectura de Google Cloud, se muestra cómo evaluar y planificar la capacidad y la cuota en la nube.

En los centros de datos convencionales, por lo general, dedicas ciclos trimestrales para revisar los requisitos de los recursos actuales y prever los requisitos futuros. Debes tener en cuenta aspectos físicos, logísticos y de recursos humanos. Se deben tener en cuenta aspectos como el espacio de bastidores, el enfriamiento, la electricidad, el ancho de banda, el cableado, los tiempos de adquisición y de envío, y la cantidad de ingenieros disponibles para montar nuevos equipos. También debes administrar de forma activa la capacidad y las distribuciones de la carga de trabajo para que los trabajos que requieren un uso intensivo de recursos, como las canalizaciones de Hadoop, no interfieran en los servicios, como los servidores web, que deben tener alta disponibilidad.

En cambio, cuando usas Google Cloud, otorgas la mayor parte de la planificación de capacidad a Google. El uso de la nube significa que no tienes que aprovisionar y mantener recursos inactivos cuando no son necesarios. Por ejemplo, puedes crear, escalar verticalmente y reducir la escala verticalmente de las instancias de VM según sea necesario. Debido a que pagas por lo que usas, puedes optimizar tus gastos, incluido el exceso de capacidad que solo necesitas en los momentos de mayor tráfico. Para ayudarte a ahorrar, Compute Engine proporciona recomendaciones de tipo de máquina si detecta que tienes instancias de VM con poco uso que se pueden borrar o cuyo tamaño se puede cambiar.

Evalúa los requisitos de capacidad de la nube

Para administrar la capacidad de manera efectiva, debes conocer los requisitos de capacidad de la organización.

Para evaluar los requisitos de capacidad, comienza por identificar las cargas de trabajo principales en la nube. Evalúa el uso promedio y máximo de estas cargas de trabajo y sus necesidades de capacidad actuales y futuras.

Identifica los equipos que usan estas cargas de trabajo principales. Trabaja con ellos para establecer un proceso interno de planificación de demanda. Usa este proceso para comprender sus necesidades de recursos de nube actuales y previstas.

Analiza el patrón de carga y la distribución de llamadas. Usa factores como el máximo de los últimos 30 días, el máximo por hora y el máximo por minuto en tu análisis.

Considera usar Cloud Monitoring para obtener visibilidad del rendimiento, el tiempo de actividad y el estado general de las aplicaciones y la infraestructura.

Visualiza las métricas de uso de infraestructura

Para facilitar la planificación de capacidad, recopila y almacena datos históricos sobre el uso de los recursos de nube de tu organización.

Asegúrate de tener visibilidad de las métricas de uso de la infraestructura. Por ejemplo, para las cargas de trabajo principales, evalúa lo siguiente:

  • Uso promedio y máximo
  • Aumentos repentinos de los patrones de uso
  • Aumentos estacionales según los requisitos comerciales, como los períodos de vacaciones para los minoristas
  • La cantidad de exceso de aprovisionamiento que se necesita para prepararse para los eventos de tráfico máximo y controlar con rapidez los posibles aumentos de tráfico

Asegúrate de que tu organización haya configurado alertas para recibir notificaciones automáticamente cuando te acerques a los límites de cuota y capacidad.

Usa las herramientas de supervisión de Google para obtener estadísticas sobre el uso y la capacidad de las aplicaciones. Por ejemplo, puedes definir métricas personalizadas con Monitoring. Usa estas métricas personalizadas para definir tendencias de alertas. Monitoring también proporciona paneles flexibles y herramientas de visualización avanzadas para identificar los problemas emergentes.

Crea un proceso para la planificación de la capacidad

Establece un proceso para la planificación de la capacidad y documentarlo.

Cuando crees este plan, haz lo siguiente:

  1. Ejecuta pruebas de carga para determinar cuánta carga puede manejar el sistema mientras cumple con sus objetivos de latencia, de acuerdo con una cantidad fija de recursos. Las pruebas de carga deben usar una combinación de tipos de solicitud que coincida con los perfiles de tráfico de producción de los usuarios activos. No uses una combinación de operaciones uniforme o aleatoria. Incluye los aumentos repentinos del uso en tu perfil de tráfico.
  2. Crea un modelo de capacidad. Un modelo de capacidad es un conjunto de fórmulas para calcular los recursos incrementales necesarios por aumento de unidad en la carga del servicio, que se determina a partir de las pruebas de carga.
  3. Prevé el tráfico futuro y considera el crecimiento. Consulta el artículo Mide las cargas futuras para obtener un resumen de cómo Google compila las previsiones del tráfico.
  4. Aplica el modelo de capacidad a la previsión para determinar las necesidades de recursos futuras
  5. Calcula el costo de los recursos que necesita tu organización. Luego, obtén la aprobación del presupuesto de tu organización de finanzas. Este paso es esencial porque la empresa puede optar por realizar compensaciones entre costo y riesgo en una variedad de productos. Esas compensaciones pueden significar la adquisición de capacidad que es inferior o superior a la necesidad prevista para un producto determinado según las prioridades empresariales.
  6. Trabaja con tu proveedor de servicios en la nube para obtener la cantidad correcta de recursos en el momento correcto con cuotas y reservas. Involucra a los equipos de infraestructura para la planificación de capacidad y haz que el equipo de operaciones cree planes de capacidad con intervalos de confianza.
  7. Repite los pasos anteriores cada uno o dos trimestres.

Para obtener orientación más detallada sobre el proceso de planificación de la capacidad y, a la vez, optimizar el uso de los recursos, consulta Planificación de la capacidad.

Asegúrate de que las cuotas coincidan con los requisitos de capacidad

Google Cloud usa cuotas para restringir cuánto de un recurso compartido particular de Google Cloud puedes usar. Cada cuota representa un recurso contable específico, como las llamadas a la API para un servicio en particular, la cantidad de balanceadores de cargas que se usan en simultáneo en tu proyecto o la cantidad de proyectos que puedes crear. Por ejemplo, las cuotas evitan que algunos clientes o proyectos monopolicen los núcleos de CPU en una región o zona específicas.

Cuando revises tu cuota, considera estos detalles:

  • Planifica los requisitos de capacidad de los proyectos con antelación para evitar limitaciones inesperadas del consumo de los recursos.
  • Configura tu cuota y tu capacidad para controlar fallas completas de la región.
  • Usa cuotas para limitar el consumo de un recurso en particular. Por ejemplo, puedes configurar una cuota máxima de uso de consultas por día en la API de BigQuery para garantizar que un proyecto no exceda el gasto en este servicio.
  • Planifica los aumentos repentinos de uso e incluye estos aumentos como parte de la planificación de la cuota. Los aumentos repentinos de uso se pueden esperar durante el día, los eventos de tráfico máximo inesperados o los eventos conocidos de lanzamiento y tráfico máximos. Para obtener detalles sobre cómo planificar el tráfico máximo y los eventos de lanzamiento, lee la siguiente sección en Excelencia operativa: Planifica para el tráfico máximo y los eventos de lanzamiento.

Si tus cuotas actuales no son suficientes, puedes administrar tu cuota con la consola de Cloud. Si necesitas una capacidad mayor, comunícate con el equipo de ventas de Google Cloud. Sin embargo, debes tener en cuenta que muchos servicios también tienen límites que no están relacionados con el sistema de cuota, consulta Trabaja con cuotas para obtener más información.

Revisa las cuotas con regularidad. Envía las solicitudes de cuota antes de que sean necesarias. Consulta Trabaja con cuotas para obtener detalles sobre cómo se evalúan las solicitudes de cuota y cómo se aprueban o rechazan las solicitudes en general.

Existen varias formas de ver y administrar tu cuota de Google Cloud:

¿Qué sigue?