概要

ECS上のコンテナをダウンタイム０で更新（デプロイ）する方法をまとめます。

環境

ALB
ECS container agent 1.13.0
Docker 1.11.2

Amazon ECS Container Agent Versions - Amazon EC2 Container Service

ポイント

minimumHealthyPercentとmaximumPercentを適切に設定する
connection drainingを適切な長さにする

この２つを意識していればOKです。

`minimumHealthyPercent`と`maximumPercent`を適切に設定する

desiredCount: 4、min: 0%、max: 100%の場合

この場合最低０つ(0%)まで縮小し、最高でも４つ(100%)までしか増えない状態で更新するということになります。
つまりダウンタイムが発生するので今回のrolling updateとは趣旨が異なります。

desiredCount: 4、min: 50%、max: 100%の場合

この場合最低２つ(50%)まで縮小し、最高でも４つ(100%)までしか増えない状態で更新するということになります。図にすると以下です。

f:id:quoll00:20161102132245p:plain

ref: Amazon ECS launches new deployment capabilities; CloudWatch metrics; Singapore and Frankfurt regions | AWS Compute Blog

全て同時に更新されるわけではなく、順々に更新されていきます。デプロイスピードは遅くなりますが、リソースの無駄が少ないです。

desiredCount: 4、min: 100%、max: 200%の場合

この場合最低でも４つ(100%)は維持し、最高８つ(200%)まで増える状態で更新するということになります。図にすると以下です。

f:id:quoll00:20161102132307p:plain

ref: Amazon ECS launches new deployment capabilities; CloudWatch metrics; Singapore and Frankfurt regions | AWS Compute Blog

リソースに余裕があるので一度に新しいコンテンが立ち上がり、古いコンテナと交換されます。デプロイスピードは早いですが、当然リソースをあらかじめ用意しておかないといけないので無駄があります。

connection drainingを適切な長さにする

AWSのELB、ALBにはconnection drainingという既存のリクエストの処理が完了するまでは接続を維持する。新しいリクエストは受け付けないという仕組みがあります。
これはgraceful restartにはとてもいいのですが、中々終わってくれなくてしばしば上限値（デフォルト300秒。これを過ぎたら強制的に接続を切る）まで続きます。
一般にクライアント側でもリクエストに10秒程度のタイムアウトを設けていますし、正直そこまで長くなくて良いと思うのでデプロイ速度を気にするのであればもっと小さくても大丈夫です。

rolling update

では実際にrolling updateを試してみます。以下のツールを使用します。

github.com

次のコマンドを実行するとデプロイができます。

$ ./ecs-deploy -c クラスタ名 -n サービス名 -i イメージ(docker.repo.com/doorman:latestという書き方)

新しいサービスに更新されてコンテナが更新されるまでをチェックしてくれます。デフォルトだと90秒以内に完了しないとエラーを吐くので（そのままコンテナは更新されますが）、リソースが少ない場合は-tでタイムアウトの上限を上げたほうがいいです。
コンテナの内１つでも新しいものに更新されればこのチェックは通るので、タイムアウトはコンテナ×１台の更新時間とする必要はありません。

動作確認

以下の条件で試したところ、4分半ほどかかりました。

インスタンス２台
コンテナ２つ（１台に１つ）
desiredCount: 2
minimumHealthyPercent: 50%
maximumPercent: 100%

f:id:quoll00:20161102135258p:plain

Carpe Diem

備忘録

ECSでコンテナのrolling update

概要

環境

ポイント

`minimumHealthyPercent`と`maximumPercent`を適切に設定する

desiredCount: 4、min: 0%、max: 100%の場合

desiredCount: 4、min: 50%、max: 100%の場合

desiredCount: 4、min: 100%、max: 200%の場合

connection drainingを適切な長さにする

rolling update

動作確認

ソース

概要

環境

ポイント

minimumHealthyPercentとmaximumPercentを適切に設定する

desiredCount: 4、min: 0%、max: 100%の場合

desiredCount: 4、min: 50%、max: 100%の場合

desiredCount: 4、min: 100%、max: 200%の場合

connection drainingを適切な長さにする

rolling update

動作確認

ソース

`minimumHealthyPercent`と`maximumPercent`を適切に設定する