分散トレースをデプロイしてマイクロサービスのレイテンシをモニタリングする

Last reviewed 2023-08-11 UTC

このドキュメントでは、分散トレースを使用してマイクロサービスのレイテンシをモニタリングするで説明されているリファレンスアーキテクチャをデプロイする方法について説明します。このドキュメントで説明するデプロイでは、OpenTelemetry と Cloud Trace を使用して、マイクロサービスアプリケーションのトレース情報をキャプチャしています。

このデプロイのサンプルアプリケーションは、Go で記述された 2 つのマイクロサービスで構成されています。

このドキュメントでは、次の内容を理解していることを前提としています。

Go プログラミング言語
Google Kubernetes Engine（GKE）

目標

GKE クラスタを作成してサンプルアプリケーションをデプロイする。
OpenTelemetry 計測コードを確認する。
計測により生成されたトレースとログを確認する。

アーキテクチャ

次の図は、デプロイするアーキテクチャを示しています。

2 つの GKE クラスタからなるデプロイのアーキテクチャ。

フルマネージドの継続的インテグレーション、デリバリー、デプロイのためのプラットフォームである Cloud Build を使用して、コンテナイメージをサンプルコードからビルドし、Artifact Registry に保存します。GKE クラスタは、デプロイ時に Artifact Registry からイメージを pull します。

フロントエンドサービスは、/ URL で HTTP リクエストを受け入れ、バックエンドサービスを呼び出します。バックエンドサービスのアドレスは環境変数により定義されます。

バックエンドサービスは / URL で HTTP リクエストを受け入れ、環境変数で定義された外部 URL に対してアウトバウンド呼び出しを実行します。外部呼び出しが完了すると、バックエンドサービスは HTTP ステータス呼び出し（200 など）を呼び出し元に返します。

費用

このドキュメントでは、Google Cloud の次の課金対象のコンポーネントを使用します。

料金計算ツールを使うと、予想使用量に基づいて費用の見積もりを生成できます。新しい Google Cloud ユーザーは無料トライアルをご利用いただける場合があります。

このドキュメントに記載されているタスクの完了後、作成したリソースを削除すると、それ以上の請求は発生しません。詳細については、クリーンアップをご覧ください。

始める前に

Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.

Google Cloud Console の [プロジェクトセレクタ] ページで、Google Cloud プロジェクトを選択または作成します。

プロジェクトセレクタに移動

Google Cloud プロジェクトで課金が有効になっていることを確認します。

GKE, Cloud Trace, Cloud Build, Cloud Storage, and Artifact Registry API を有効にします。

API を有効にする

Google Cloud Console の [プロジェクトセレクタ] ページで、Google Cloud プロジェクトを選択または作成します。

プロジェクトセレクタに移動

Google Cloud プロジェクトで課金が有効になっていることを確認します。

GKE, Cloud Trace, Cloud Build, Cloud Storage, and Artifact Registry API を有効にします。

API を有効にする

環境を設定する

このセクションでは、デプロイ全体で使用するツールで環境を設定します。このデプロイでは、すべてのターミナルコマンドを Cloud Shell から実行します。

Google Cloud コンソールで、「Cloud Shell をアクティブにする」をクリックします。

Cloud Shell をアクティブにする

Google Cloud コンソールの下部で Cloud Shell セッションが開始し、コマンドラインプロンプトが表示されます。Cloud Shell はシェル環境です。Google Cloud CLI がすでにインストールされており、現在のプロジェクトの値もすでに設定されています。セッションが初期化されるまで数秒かかることがあります。

環境変数に Google Cloud プロジェクトの ID を設定します。

export PROJECT_ID=$(gcloud config list --format 'value(core.project)' 2>/dev/null)

関連する Git リポジトリのクローンを作成して、このデプロイに必要なファイルをダウンロードします。
```
git clone https://github.com/GoogleCloudPlatform/kubernetes-engine-samples.git
cd kubernetes-engine-samples/observability/distributed-tracing
WORKDIR=$(pwd)
```
リポジトリフォルダを作業ディレクトリ（$WORKDIR）にして、このデプロイに関連するすべてのタスクを実行します。これにより、リソースを保持する必要がない場合は、デプロイの完了時にフォルダを削除できます。

ツールをインストールする

Cloud Shell で kubectx と kubens をインストールします。
```
git clone https://github.com/ahmetb/kubectx $WORKDIR/kubectx
export PATH=$PATH:$WORKDIR/kubectx
```
複数の Kubernetes クラスタ、コンテキスト、名前空間を操作するときにこれらのツールを使用します。
Cloud Shell で、オープンソースの負荷生成ツールである Apache Bench をインストールします。
```
sudo apt-get install apache2-utils
```

Docker リポジトリを作成する

このデプロイのサンプルイメージを保存する Docker リポジトリを作成します。

コンソール

Google Cloud コンソールで、[リポジトリ] ページを開きます。

[リポジトリ] ページを開く
[リポジトリを作成] をクリックします。
リポジトリ名として distributed-tracing-docker-repo を指定します。
形式として Docker を選択し、モードとして Standard を選択します。
[ロケーションタイプ] で、[リージョン] を選択し、ロケーション us-west1 を選択します。
[作成] をクリックします。

このリポジトリがリポジトリリストに追加されます。

gcloud

Cloud Shell で、ロケーション us-west1 と説明 docker repository を使用して、distributed-tracing-docker-repo という名前の新しい Docker リポジトリを作成します。
```
gcloud artifacts repositories create distributed-tracing-docker-repo --repository-format=docker \
--location=us-west1 --description="Docker repository for distributed tracing deployment"
```
リポジトリが作成されたことを確認します。
```
gcloud artifacts repositories list
```

GKE クラスタを作成する

このセクションでは、サンプルアプリをデプロイする 2 つの GKE クラスタを作成します。デフォルトでは、作成される GKE クラスタには Cloud Trace API への書き込み専用アクセス権が付与されるため、クラスタの作成時にアクセス権を定義する必要はありません。

Cloud Shell でクラスタを作成します。

gcloud container clusters create backend-cluster \
    --zone=us-west1-a \
    --verbosity=none --async

gcloud container clusters create frontend-cluster \
    --zone=us-west1-a \
    --verbosity=none

この例では、クラスタは us-west1-a ゾーンにあります。詳細については、地域とリージョンをご覧ください。

クラスタ資格情報を取得し、ローカルに保存します。

gcloud container clusters get-credentials backend-cluster --zone=us-west1-a
gcloud container clusters get-credentials frontend-cluster --zone=us-west1-a

クラスタのコンテキストの名前を変更し、後でデプロイで簡単にアクセスできるようにします。
```
kubectx backend=gke_${PROJECT_ID}_us-west1-a_backend-cluster
kubectx frontend=gke_${PROJECT_ID}_us-west1-a_frontend-cluster
```

OpenTelemetry の計測を確認する

以降のセクションでは、サンプルアプリケーションの main.go ファイルのコードを確認します。コンテキスト伝播を使用して、複数のリクエストのスパンを 1 つの親トレースに追加する方法を確認できます。

アプリケーションコードのインポートを確認する

import (
	"context"
	"fmt"
	"io/ioutil"
	"log"
	"net/http"
	"os"
	"strconv"

	cloudtrace "github.com/GoogleCloudPlatform/opentelemetry-operations-go/exporter/trace"
	"github.com/gorilla/mux"
	"go.opentelemetry.io/contrib/detectors/gcp"
	"go.opentelemetry.io/contrib/instrumentation/net/http/otelhttp"
	"go.opentelemetry.io/contrib/propagators/autoprop"
	"go.opentelemetry.io/otel"
	"go.opentelemetry.io/otel/sdk/resource"
	"go.opentelemetry.io/otel/sdk/trace"
)

インポートについて次の点に注意してください。

go.opentelemetry.io/contrib/instrumentation/net/http/otelhttp パッケージには、HTTP サーバーまたは HTTP クライアントを計測可能にする otelhttp プラグインが含まれています。サーバーの計測は、HTTP リクエストからスパンコンテキストを取得し、サーバーがリクエストを処理できるようにスパンを記録します。クライアントの計測により、スパンコンテキストが送信 HTTP リクエストに挿入され、レスポンスの待機に費やされた時間のスパンが記録されます。
go.opentelemetry.io/contrib/propagators/autoprop パッケージは、伝播を処理するために otelhttp によって使用される OpenTelemetry TextMapPropagator インターフェースの実装を提供します。プロパゲータにより、HTTP などのトランスポートでトレースコンテキストを保存するために使用される形式とキーが決定されます。具体的には、otelhttp は HTTP ヘッダーをプロパゲータに渡します。プロパゲータは、ヘッダーからスパンコンテキストを Go コンテキストに抽出するか、Go コンテキストのスパンコンテキストをエンコードしてヘッダーに挿入します（これはクライアントかサーバーかによって異なります）。デフォルトでは、autoprop パッケージは W3C トレースコンテキストの伝播形式を使用して、スパンコンテキストの挿入と抽出を行います。
github.com/GoogleCloudPlatform/opentelemetry-operations-go/exporter/trace インポートはトレースを Cloud Trace にエクスポートします。
github.com/gorilla/mux インポートは、サンプルアプリケーションがリクエスト処理に使用するライブラリです。
go.opentelemetry.io/contrib/detectors/gcp インポートにより、Google Cloud 内でアプリケーションが実行される場所を表す cloud.availability_zone などの属性がスパンに追加されます。
go.opentelemetry.io/otel、go.opentelemetry.io/otel/sdk/trace、go.opentelemetry.io/otel/sdk/resource インポート。OpenTelemetry の設定に使用されます。

`main` 関数を確認します。

main 関数は、Cloud Trace へのトレースエクスポートを設定し、mux ルーターを使用して / URL に対するリクエストを処理します。

func main() {
	ctx := context.Background()
	// Set up the Cloud Trace exporter.
	exporter, err := cloudtrace.New()
	if err != nil {
		log.Fatalf("cloudtrace.New: %v", err)
	}
	// Identify your application using resource detection.
	res, err := resource.New(ctx,
		// Use the GCP resource detector to detect information about the GKE Cluster.
		resource.WithDetectors(gcp.NewDetector()),
		resource.WithTelemetrySDK(),
	)
	if err != nil {
		log.Fatalf("resource.New: %v", err)
	}
	tp := trace.NewTracerProvider(
		trace.WithBatcher(exporter),
		trace.WithResource(res),
	)
	// Set the global TracerProvider which is used by otelhttp to record spans.
	otel.SetTracerProvider(tp)
	// Flush any pending spans on shutdown.
	defer tp.ForceFlush(ctx)

	// Set the global Propagators which is used by otelhttp to propagate
	// context using the w3c traceparent and baggage formats.
	otel.SetTextMapPropagator(autoprop.NewTextMapPropagator())

	// Handle incoming request.
	r := mux.NewRouter()
	r.HandleFunc("/", mainHandler)
	var handler http.Handler = r

	// Use otelhttp to create spans and extract context for incoming http
	// requests.
	handler = otelhttp.NewHandler(handler, "server")
	log.Fatal(http.ListenAndServe(fmt.Sprintf(":%v", os.Getenv("PORT")), handler))
}

このコードについては次の点に注意してください。

OpenTelemetry TracerProvider を構成します。これにより、Google Cloud 上での実行時に属性が検出され、Cloud Trace にトレースがエクスポートされます。
TracerProvider と Propagator のグローバル設定を指定するには、otel.SetTracerProvider 関数と otel.SetTextMapPropagators 関数を使用します。デフォルトでは、otelhttp などの計測ライブラリは、グローバルに登録された TracerProvider を使用してスパンを作成し、Propagator を使用してコンテキストを伝播します。
HTTP サーバーを otelhttp.NewHandler でラップして、HTTP サーバーを計測します。

`mainHandler` 関数を確認する

func mainHandler(w http.ResponseWriter, r *http.Request) {
	// Use otelhttp to record a span for the outgoing call, and propagate
	// context to the destination.
	destination := os.Getenv("DESTINATION_URL")
	resp, err := otelhttp.Get(r.Context(), destination)
	if err != nil {
		log.Fatal("could not fetch remote endpoint")
	}
	defer resp.Body.Close()
	_, err = ioutil.ReadAll(resp.Body)
	if err != nil {
		log.Fatalf("could not read response from %v", destination)
	}

	fmt.Fprint(w, strconv.Itoa(resp.StatusCode))
}

宛先に対するアウトバウンドリクエストのレイテンシをキャプチャするには、otelhttp プラグインを使用して HTTP リクエストを送信します。また、次のリストのように、r.Context 関数を使用して受信リクエストを送信リクエストにリンクします。

// Use otelhttp to record a span for the outgoing call, and propagate
// context to the destination.
resp, err := otelhttp.Get(r.Context(), destination)

アプリケーションをデプロイする

このセクションでは、Cloud Build を使用してバックエンドサービスとフロントエンドサービスのコンテナイメージをビルドし、GKE クラスタにデプロイします。

Docker コンテナをビルドする

Cloud Shell で、作業ディレクトリからビルドを送信します。

cd $WORKDIR
gcloud builds submit . --tag us-west1-docker.pkg.dev/$PROJECT_ID/distributed-tracing-docker-repo/backend:latest

コンテナイメージが正常に作成され、Artifact Registry で利用できることを確認します。
```
gcloud artifacts docker images list us-west1-docker.pkg.dev/$PROJECT_ID/distributed-tracing-docker-repo
```
次のような出力の場合、コンテナイメージが正常に作成されています。ここで、PROJECT_ID は Google Cloud プロジェクトの ID です。
```
NAME
us-west1-docker.pkg.dev/PROJECT_ID/distributed-tracing-docker-repo/backend
```

バックエンドサービスをデプロイする

Cloud Shell で kubectx コンテキストを backend クラスタに設定します。
```
kubectx backend
```

backend Deployment の YAML ファイルを作成します。

export PROJECT_ID=$(gcloud info --format='value(config.project)')
envsubst < backend-deployment.yaml | kubectl apply -f -

Pod が実行されていることを確認します。

kubectl get pods

出力では、Status の値が Running になります。

NAME                       READY   STATUS    RESTARTS   AGE
backend-645859d95b-7mx95   1/1     Running   0          52s
backend-645859d95b-qfdnc   1/1     Running   0          52s
backend-645859d95b-zsj5m   1/1     Running   0          52s

ロードバランサを使用して backend デプロイを公開します。
```
kubectl expose deployment backend --type=LoadBalancer
```
backend サービスの IP アドレスを取得します。
```
kubectl get services backend
```
出力は次のようになります。
```
NAME      TYPE           CLUSTER-IP     EXTERNAL-IP    PORT(S)          AGE
backend   LoadBalancer   10.11.247.58   34.83.88.143   8080:30714/TCP   70s
```
EXTERNAL-IP フィールドの値が <pending> の場合は、値が IP アドレスになるまでこのコマンドを繰り返します。

前の手順の IP アドレスを変数として取得します。

export BACKEND_IP=$(kubectl get svc backend -ojson | jq -r '.status.loadBalancer.ingress[].ip')

フロントエンドサービスをデプロイする

Cloud Shell で kubectx コンテキストをバックエンドクラスタに設定します。
```
kubectx frontend
```

frontend Deployment の YAML ファイルを作成します。

export PROJECT_ID=$(gcloud info --format='value(config.project)')
envsubst < frontend-deployment.yaml | kubectl apply -f -

Pod が実行されていることを確認します。

kubectl get pods

出力では、Status の値が Running になります。

NAME                        READY   STATUS    RESTARTS   AGE
frontend-747b445499-v7x2w   1/1     Running   0          57s
frontend-747b445499-vwtmg   1/1     Running   0          57s
frontend-747b445499-w47pf   1/1     Running   0          57s

ロードバランサを使用して frontend デプロイを公開します。
```
kubectl expose deployment frontend --type=LoadBalancer
```
frontend サービスの IP アドレスを取得します。
```
kubectl get services frontend
```
出力は次のようになります。
```
NAME       TYPE           CLUSTER-IP     EXTERNAL-IP     PORT(S)         AGE
frontend   LoadBalancer   10.27.241.93   34.83.111.232   8081:31382/TCP  70s
```
EXTERNAL-IP フィールドの値が <pending> の場合は、値が IP アドレスになるまでこのコマンドを繰り返します。

前の手順の IP アドレスを変数として取得します。

export FRONTEND_IP=$(kubectl get svc frontend -ojson | jq -r '.status.loadBalancer.ingress[].ip')

アプリケーションを読み込んでトレースを確認する

このセクションでは、Apache Bench ユーティリティを使用して、アプリケーションに対するリクエストを作成します。その後、Cloud Trace で結果のトレースを確認します。

Cloud Shell で Apache Bench を使用し、3 つの同時実行スレッドを使用して 1,000 件のリクエストを生成します。
```
ab -c 3 -n 1000 http://${FRONTEND_IP}:8081/
```
Google Cloud コンソールで、[トレースリスト] ページに移動します。

トレースリストに移動
タイムラインを確認するには、server というラベルの付いた URI のいずれかをクリックします。

このトレースには、次の名前の 4 つのスパンが含まれています。
- 最初の server スパンは、フロントエンドサーバーで HTTP リクエストを処理するエンドツーエンドのレイテンシをキャプチャします。
- 最初の HTTP GET スパンは、フロントエンドのクライアントがバックエンドに対して行う GET 呼び出しのレイテンシをキャプチャします。
- 2 番目の server スパンは、バックエンドサーバーで HTTP リクエストを処理するエンドツーエンドのレイテンシをキャプチャします。
- 2 番目の HTTP GET スパンは、バックエンドのクライアントが google.com に対して行う GET 呼び出しのレイテンシをキャプチャします。

クリーンアップ

課金を停止する最も簡単な方法は、デプロイ用に作成した Google Cloud プロジェクトを削除することです。また、リソースを個別に削除することもできます。

プロジェクトを削除する

In the Google Cloud console, go to the Manage resources page.
Go to Manage resources
In the project list, select the project that you want to delete, and then click Delete.
In the dialog, type the project ID, and then click Shut down to delete the project.

リソースを個別に削除する

プロジェクト全体を削除するのではなく、個々のリソースを削除するには、Cloud Shell で次のコマンドを実行します。

gcloud container clusters delete frontend-cluster --zone=us-west1-a
gcloud container clusters delete backend-cluster --zone=us-west1-a
gcloud artifacts repositories delete distributed-tracing-docker-repo --location us-west1

次のステップ

OpenTelemetry について学習する。
リファレンスアーキテクチャ、図、ベストプラクティスについては、Cloud アーキテクチャセンターをご確認ください。

分散トレースをデプロイしてマイクロサービスのレイテンシをモニタリングする

目標

アーキテクチャ

費用

始める前に

環境を設定する

ツールをインストールする

Docker リポジトリを作成する

コンソール

gcloud

GKE クラスタを作成する

OpenTelemetry の計測を確認する

アプリケーション コードのインポートを確認する

main 関数を確認します。

mainHandler 関数を確認する

アプリケーションをデプロイする

Docker コンテナをビルドする

バックエンド サービスをデプロイする

フロントエンド サービスをデプロイする

アプリケーションを読み込んでトレースを確認する

クリーンアップ

プロジェクトを削除する

リソースを個別に削除する

次のステップ

アプリケーションコードのインポートを確認する

`main` 関数を確認します。

`mainHandler` 関数を確認する

バックエンドサービスをデプロイする

フロントエンドサービスをデプロイする