Capacity Provider

工作上剛好用到 capacity provider，看了很多文件，覺得不做個紀錄一定又會忘記

Updates:

2021/9/10 更新：多一點 ECS 的介紹
2021/9/9 更新：補上 service 跟 strategy 的關聯

Outline

Intro of ECS system
Intro of ECS scaling system
Intro to capacity provider
Build capacaity provider with cloudformation
Note

Intro of ECS system

要介紹 capacity provider，最好先知道為什麼需要它存在，因此先介紹一下 ECS 這個叢集管理系統

基礎的介紹可能 google 一下就會有很多，這邊從他的架構上來做介紹，基本上跟 K8S 有些相像，只是 K8S 的 cluster 裡面 master node 需要自己管理，而 AWS 的 cluster 運作機制全權交給 AWS 負責，所以少了很多瑣碎的設定，當然也少了很多可以客製化的部分

一個 ECS 系統可以分成 container 的一邊跟 EC2 instance 的一邊

Container side

container side

在 container 這邊，我們把打包好的 image 放到 ECR，把他寫在 task definition 來定義 task，task 是 ECS 裡面操作的最小單位，就像是 K8S 的 pod

我們可以由定義好的 task definition 執行 task，如果想維持 task 一直在運行的狀態，可以用 service 把 task 包起來，然後放進去 ECS cluster，cluster 會負責維持這些 service 在想要的狀態，像是如果 service 裡面的 task 掛掉，就會重新跑一個起來取代

Instance side

instance side

在 instance 這邊，我們用 auto scaling group(ASG) 控制 EC2 instance 的數量，所以會在 ASG 身上定義 launch condition，像是 EC2 的 AMI 要用哪一個還有 instance type 等等

在 ECS 系統中，有多少個 instance 代表這個 cluster 裡面有多少空間可以拿來放 service 的 tasks

Combine both sides

instance with task

最後的結果會是像上圖這樣，一個 cluster 裡面有多個 container instances，每個 instance 裡面會裝各種 task，一個 service 裡面包含的多個 task 可能散落在多個 instance(像是途中的灰色 task)

接著來看兩邊原本 auto scale 的機制

Intro of ECS scaling system

container side auto scale

在 container 這邊，我們可以透過 cloudwatch alarm 監控 cpu / memory 來讓 ECS service 的 task 數量自動增減

instance side auto scale

在 instance 這邊，也可以一樣透過 cloudwatch alarm 監控 cpu / memory 來讓 ASG 自動增減 instance 數量

![combine both side](https://i.imgur.com/faVg4UD.png

如上圖，問題在於要怎麼讓兩邊的 scaling 機制結合起來(為了簡化圖形跟概念，先把 task 直接稱為 app，並拿掉中間 service 這層虛擬的關聯)

如果要自己實作可能要幾個困難點：

在 scale in 的時候，我們會把 task 關掉，如果 resource 夠，我們希望可以把多餘的 instance 關掉，而且不能關到 instance 上面還有 task 在跑的
在 scale out 的時候，我們要把 task 開起來，如果 resource 不夠，auto scaling group 要能夠自動開啟新的 instance

這時候就可以使用 capacity provider

Intro to capacity provider

ECS with capacity provider

capacity provider 的概念像是上面這樣，在作出 capacity provider 的時候，會產生一個特殊的 metric 叫做 CapacityProviderReservation，主要就是靠這個 metric 來調節 instance 數量

這個 metric 的概念是 task number / instance number x 100%，要注意這邊的 number 是相對的

比方說 8 個 task 剛好符合 4 個 instance 的資源，目前狀態剛好是 8 個 task 跟 4 個 instance，那這個數值會是 100%，而如果是 10 個 task 跟 4 個 instance，那數值就是 5 / 4 * 100% = 125%

在我們建立 capacity proivder 的時候，要指定一個 target capacity 的數值，就會對應到上面的 CapacityProviderReservation metric，capacity provider 會盡量讓這個 metric 的數值符合我們設定的 target capacity

如果設定 100%，在上面的例子中，因為 task scale out 了，metric 變成 125%，為了符合 metric，capacity provider 就會讓 ASG scale out，讓 instance 變成 5 台，這樣 metric 又變回 100%

如果設定為 50%，代表我們想讓 task 在平常只佔用所有 instance resource 的 50%，在上面的例子中 8 個 task 跟 4 個 instance 的狀況是夠用的，但為了符合設定的 target capacity，他會再 scale out 另外 4 個 instance，讓 metric 變成 50 %

另外官方文件還提到一點：

with a preference for the metric to be less than the target value if possible.

就是說如果現在有個尷尬的狀況，現在是 60%，如果再 scale out 一個 instance 會變成 40%，而我們的 target 設定 50%，他會傾向確保 instance 數量是夠的，所以這時候會再去 scale，讓 metric 變成 40%

目前找不太到 AWS 究竟是怎麼算出這個數值的，default 似乎是 CPU，不過如果到時候想要 create task，但不是 cpu 太高，而是記憶體不足，這個 task 依舊會是 provisioning state，這時候一樣會把 metirc 值調高(筆者已經實驗過)，所以還是會 trigger 另一次的 auto scale out

Note: 在以前，如果要跑一個 task 起來但 resource 不夠，就會直接不跑，現在這個 task 會進入 provisioning state，最多一個 cluster 裡面會有 100 個 task 在這個狀態，他們最多會等待10 and 30 minutes，如果在這段期間還沒有足夠的 instance，他們會被停掉

值得一提的是，如果要一次 scale 大量 instance 的情況下，不一定 metric 預測得準，一樣會先猜測會需要多少個 instance 然後去 provision，但如果猜得不準，仍然有正在 provisioning state 的 task，那就會 trigger 另一個 scaling out 直到沒有 provisioning 的 task

想更了解運作機制的細節可以看這篇官方的 deep dive

最後補充一下，在圖上有在 service 跟 capacity provider 畫上關聯，這是指在 create service 的時候可以指定 capacity provider strategy，如果不指定，他會選擇其中一個 weight > 0 的 strategy

Build capacaity provider with cloudformation

capacity provider 跟 auto scaling group 是一對一的關聯

使用 CFn 的時候，我們要把 capacity provider 跟 ECS cluster 的關係建立起來，我們可以直接在 ECS cluster 底下指定 capacity provider，或者建立 AWS::ECS::ClusterCapacityProviderAssociations 這個 resource 專門把關連建立起來

這篇文章建議最好做出新的 ASG，如果用原本的 ASG 可能導致不會正確註冊到 capacity provider