K8s新設Checkpoint Restore工作組,強化搶佔與跨節點調度的狀態保存
工作組目標與功能
工作組希望透過檢查點保存運行狀態,並在另一個節點完成還原後接續運行,讓跨節點搬遷在不幹擾工作負載的前提下更可行,也讓叢集維運與資源調度更有彈性。
優先討論方向
- 互動式工作負載的資源使用最佳化
- 縮短長初始化應用的啟動時間
- 長時間工作負載的容錯能力
- 中斷感知排程(Interruption-aware Scheduling)與跨節點搬遷
協作平臺
該工作組作為Kubernetes貢獻者與CRIU(Checkpoint/Restore In Userspace)社群討論需求的協作平臺,推動檢查點與還原能力與Kubernetes的整合。
