Skip to content

控制平面 (Control Plane)

KServe Control Plane: 負責協調 InferenceService 自定義資源。它為 predictortransformerexplainer 創建 Knative serverless 部署,並根據傳入的請求工作負載啟用自動縮放,包括在未收到流量時縮小到零。當啟用 raw deployment 模式時,控制平面創建 Kubernetes deployment、service、ingress、HPA。

控制平面組件

  • KServe Controller : 負責創建 service、ingress 資源、model server 容器和模型代理容器,用於請求/響應日誌記錄、批次處理和模型拉取。

  • Ingress Gateway : 用於路由外部或內部請求的網關。

在 Serverless 模式下:

  • Knative Serving Controller :負責服務修訂管理、創建網絡路由資源、帶有隊列代理的無服務器容器以公開流量指標並強制執行併發限制。

  • Knative Activator:將縮減為零的 pod 恢復並轉發請求。

  • Knative Autoscaler (KPA) :觀察流向應用程序的流量,並根據配置的指標向上或向下擴展副本。