용량 및 할당량 관리

Last reviewed 2023-08-21 UTC

Google Cloud 아키텍처 프레임워크의 이 문서에서는 클라우드에서 용량 및 할당량을 평가하고 계획하는 방법을 보여줍니다.

기존 데이터 센터에서는 일반적으로 매 분기에 현재 리소스 요구 사항을 검토하고 미래 요구 사항을 예측하느라 많은 시간을 소비합니다. 물리적, 물류 관련, 인적 자원 관련 우려사항을 고려해야 합니다. 즉, 랙 공간, 냉방, 전기, 대역폭, 케이블 배선, 조달 시간, 배송 시간, 새 장비를 랙에 설치하고 쌓아 올릴 엔지니어 수와 같은 문제를 고려해야 합니다. 또한 용량과 워크로드 분산을 적극적으로 관리하여 Hadoop 파이프라인과 같은 리소스 소비량이 많은 작업이 웹 서버와 같이 고가용성을 유지해야 하는 서비스를 간섭하지 않도록 해야 합니다.

반면에 Google Cloud를 사용할 때는 용량 계획을 대부분 Google에 양도하게 됩니다. 클라우드를 사용하면 필요하지 않은 경우에 유휴 리소스를 프로비저닝 및 유지할 필요가 없습니다. 예를 들어 필요에 따라 VM 인스턴스를 만들고, 확장, 축소할 수 있습니다. 사용한 만큼만 비용을 지불하기 때문에 최대 트래픽 시간에만 필요한 초과 용량을 포함하여 지출을 최적화할 수 있습니다. 비용 절약을 위해 Compute Engine은 크기 조정 또는 삭제가 가능한 미사용 VM 인스턴스가 감지될 때 머신 유형 권장사항을 제공합니다.

클라우드 용량 요구사항 평가

용량을 효과적으로 관리하기 위해서는 조직의 용량 요구사항을 알아야 합니다.

용량 요구사항을 평가하려면 먼저 주요 클라우드 워크로드를 식별해야 합니다. 이러한 워크로드의 평균 및 최대 사용률과 현재 및 미래의 용량 요구사항을 평가하세요.

이러한 주요 워크로드를 사용하는 팀도 파악해야 합니다. 해당 팀과 협력하여 내부 수요 계획 프로세스를 마련합니다. 이 프로세스를 사용하여 현재 및 예상 클라우드 리소스 요구사항을 파악합니다.

부하 패턴 및 호출 분산을 분석하세요. 지난 30일 최고 사용량, 시간별 최고 사용량, 분당 최고 사용량 등의 요인을 분석에 사용합니다.

Cloud Monitoring을 사용하여 애플리케이션과 인프라의 성능, 업타임, 전반적인 상태를 파악해 보세요.

인프라 사용률 측정항목 보기

쉽게 용량 계획을 세울 수 있도록 조직의 클라우드 리소스 사용에 대한 이전 데이터를 수집하고 저장합니다.

인프라 사용률 측정항목에 대한 가시성을 확보해야 합니다. 예를 들어 주요 워크로드의 다음 항목을 평가합니다.

  • 평균 및 최대 사용률
  • 사용 패턴 급증
  • 소매업체 연말연시 기간 등 비즈니스 요구사항에 따른 시즌별 급증
  • 급증 이벤트를 대비하고 잠재적 트래픽 급증을 빠르게 처리하는 데 필요한 초과 프로비저닝

할당량 및 용량 제한에 임박하면 자동으로 알리도록 조직에서 알림을 설정했는지 확인합니다.

Google 모니터링 도구를 사용하여 애플리케이션 사용 및 용량에 대한 통계를 확인합니다. 예를 들어 Monitoring으로 커스텀 측정항목을 정의할 수 있습니다. 이러한 커스텀 측정항목을 사용하여 알림 추세를 정의합니다. 또한 모니터링은 시급한 문제를 식별하는 데 도움이 되는 유연한 대시보드와 풍부한 시각화 도구도 제공합니다.

용량 계획 프로세스 만들기

용량 계획 프로세스를 수립하고 이 계획을 문서화하세요.

이 계획을 만들 때는 다음 단계를 따르세요.

  1. 부하 테스트를 실행하여 고정된 리소스 수량에 따라 지연 시간 목표를 충족하면서도 시스템이 처리할 수 있는 부하를 확인합니다. 부하 테스트에서는 실시간 사용자의 프로덕션 트래픽 프로필과 일치하는 요청 유형을 혼합하여 사용해야 합니다. 균일하거나 무작위로 혼합된 방식으로 작업을 사용하지 마세요. 트래픽 프로필 사용량에 사용량 급증을 포함합니다.
  2. 용량 모델을 만듭니다. 용량 모델은 부하 테스트로부터 확인된 대로 서비스 부하에서 단위별 증가에 필요한 증분 리소스를 계산하기 위한 일련의 수식입니다.
  3. 향후 트래픽을 예측하고 성장에 대비합니다. Google에서 트래픽 예측을 빌드하는 방법에 대한 요약은 향후 qngk 측정 문서를 참조하세요.
  4. 예측에 용량 모델을 적용해서 이후 리소스 수요를 결정합니다.
  5. 조직에 필요한 리소스 비용을 예상합니다. 그런 후 재무 조직에서 예산 승인을 받습니다. 비즈니스가 다양한 제품 범위 중에서 비용과 위험 사이의 절충안을 선택할 수 있기 때문에 이 단계가 필수적입니다. 이러한 절충안은 비즈니스 우선순위에 따라 지정된 제품의 예상 수요보다 낮거나 높은 용량을 확보하는 것을 의미할 수 있습니다.
  6. 클라우드 제공업체와 협력하여 할당량과 예약을 통해 필요한 시기에 정확한 양의 리소스를 확보하세요. 용량을 계획할 때 인프라팀을 참여시키고 운영팀에서 신뢰 구간을 사용해 용량 계획을 세우도록 합니다.
  7. 1~2분기에 한 번씩 이전 단계를 반복합니다.

리소스 사용량을 최적화하고 용량을 계획하는 프로세스에 대한 자세한 가이드는 용량 계획을 참조하세요.

할당량이 용량 요구사항과 일치하는지 확인

Google Cloud는 할당량을 사용해서 사용 가능한 특정 공유 Google Cloud 리소스의 양을 제한합니다. 각 할당량은 특정 서비스에 대한 API 호출, 프로젝트에서 동시에 사용하는 부하 분산기 수, 사용자가 만들 수 있는 프로젝트 수와 같이 계수할 수 있는 특정 리소스를 나타냅니다. 예를 들어 할당량을 사용하면 일부 고객 또는 프로젝트가 특정 리전 또는 영역에서 CPU 코어를 독점할 수 없도록 보장할 수 있습니다.

할당량을 검토할 때는 다음 세부정보를 고려하세요.

  • 예상치 못한 리소스 소비 제한을 방지하려면 프로젝트의 용량 요구사항을 사전에 계획하세요.
  • 전체 리전 장애를 처리할 수 있도록 할당량 및 용량을 설정합니다.
  • 할당량을 사용해서 특정 리소스 소비에 상한을 설정합니다. 예를 들어 BigQuery API를 대상으로 최대 일일 쿼리 사용량 할당량을 설정하여 프로젝트가 BigQuery에 과도한 비용을 소비하지 않도록 할 수 있습니다.
  • 사용량 급증을 계획하고 할당량 계획의 일부에 이러한 급증을 포함합니다. 사용량 급증은 하루 중에도 계속 변동될 것으로 예상될 수 있고, 예기치 않은 최대 트래픽 이벤트 또는 알려진 최대 트래픽 및 출시 이벤트가 발생할 수 있습니다. 최대 트래픽 및 출시 이벤트를 계획하는 방법에 대한 자세한 내용은 운영 우수성: 최대 트래픽 및 출시 이벤트 계획의 다음 섹션을 참조하세요.

현재 할당량이 충분하지 않으면 Google Cloud 콘솔을 사용해서 할당량을 관리할 수 있습니다. 더 큰 용량이 필요한 경우 Google Cloud 영업팀에 문의하세요. 하지만 많은 서비스에 할당량 시스템과 관련되지 않은 제한도 있다는 것을 알아야 합니다. 자세한 내용은 할당량 작업을 참조하세요.

할당량을 정기적으로 검토하세요. 할당량이 더 필요해지기 전에 할당량 요청을 제출하세요. 할당량 요청을 어떻게 평가하고 요청을 어떻게 승인하거나 거부하는지에 대한 자세한 내용은 할당량 작업을 참조하세요.

Google Cloud 할당량을 보고 관리하는 방법에는 여러 가지가 있습니다.

다음 단계