国产美女主播视频一区_国产精品蜜臀在线观看_亚洲成人动漫一区_亚洲视屏在线播放

首頁 > 訪談

焦點熱門:螞蟻集團云原生智能容量技術 KapacityStack 正式開源

來源:技術聯盟 時間:2023-06-25 05:45:58

Kapacity 金融級分布式架構 2023-06-21 19:18 發表于浙江

KapacityStack 基于螞蟻內部的超大規模生產業務實踐,旨在為用戶提供一套具備完善技術風險能力的、智能且開放的云原生容量技術,幫助用戶安全穩定地實現極致降本增效,解決容量相關問題。


(相關資料圖)

主代碼倉庫的 GitHub 地址為:

/traas-stack/kapacity

背景介紹

數字經濟時代,社會各行各業對數據和算力的需求急速增長,但是算力需求的飆升和粗放利用卻造成了大量的資源消耗和碳排放,同時也給企業帶來了巨大的成本壓力。在國家“雙碳”戰略背景下,通過數字化創新技術手段提高資源使用效率、減少資源浪費和降低碳排放成為了業界共識。

螞蟻集團從 2019 年開始就對“綠色計算”技術進行探索,并基于“離在線混合部署、AI 彈性容量、云原生分時調度、綠色 AI”四大技術打造了綠色計算技術體系。

在 2022 年雙 11 期間,螞蟻集團通過“綠色計算”技術節省 萬度電,可供一盞普通節能燈使用 1 億 5 千萬個小時;減排 947 噸二氧化碳量,約等于 79000 棵樹的年碳吸存量。

近幾年來,我們在云原生架構的基礎上圍繞螞蟻“綠色計算”的 AI 彈性容量技術做了非常多的研究和建設,包含容量彈性、容量數據智能、容量穩定性、容量運維與資源運營等,在長年累月的生產實踐中磨練出了很多優秀的算法,也沉淀了大量技術風險的最佳實踐,目前已能安全穩定地為螞蟻持續節省年均約 10w 核的算力成本。

此外,我們也積極地進行著這些技術的開放,支持了螞蟻商業化 SOFAStack 產品與支付寶小程序云等,滿足眾多合作伙伴的云原生容量需求。

今天,我們將這套內部技術加以濃縮凝練,以完全云原生化的方式構建了一套開放可擴展的智能容量技術體系,將其開源為了 KapacityStack 項目 (以下簡稱 Kapacity ) ,希望和業界分享并共同演進云原生容量相關技術。

重點技術特性

云最大的優勢在于給用戶提供彈性的資源供給,在目前主流的云原生應用場景下,最常見可行的彈性手段就是對應用容器的副本數做動態擴縮容,其在社區上的代表性技術就是 Kubernetes 原生的 Pod 水平自動擴縮 (HPA) 能力,但該能力在實際大規模生產使用上的效果和實用度上卻并不理想,主要由以下幾個原因導致:

HPA 的自動擴縮容通過響應式的方式驅動,僅當應用負載已經超出設定水位時才會觸發擴容,此時容量風險已經出現,只能起到應急的作用而非提前規避風險,尤其對于自身啟動時間較長的應用,幾乎起不到快速應對流量洪峰的作用。 HPA 通過簡單的指標折比來計算擴縮容目標副本數,只適用于應用副本數和相關指標呈嚴格線性相關的理想場景,但實際生產當中應用的各類指標和副本數之間存在錯綜復雜的關系,該算法很難得到符合容量水位要求的副本數。 容量彈性作為變更故障率較高的一類場景,HPA 除了支持限制擴縮容速率外沒有提供任何其他的風險防控手段,在穩定性要求較高的生產環境中大規模落地是很難令人放心的。 HPA 作為 Kubernetes 內置能力,一方面自然有其開箱即用的好處,但另一方面也使其綁定在了具體的 K8s 版本上,自身的行為難以被用戶擴展或調整,難以滿足各類用戶在不同應用場景下的定制化需求。

Kapacity 的第一個開源核心能力—— IHPA (全稱 Intelligent Horizontal Pod Autoscaler) 就是為了解決上述所有問題應運而生的。它具有下面的幾個重要技術特性:

容量彈性本質上是一個數據驅動決策的過程,而非簡單的擴縮容。IHPA 支持在不同場景因地制宜地使用不同的算法,除了簡單的定時與響應式算法,其還支持多種智能算法如預測式、突增式等,同時支持按自定義配置策略對算法進行組合生效,從而能夠適配更多業務場景、擴縮容的決策也更為精準。

以預測式算法為例,在生產上,應用的容量水位通常會受到多條外部流量,甚至是自身定時任務、機器性能等的影響,且副本數與容量水位之間的關系也未必是線性,這為基于應用容量的副本數預測帶來了很大的挑戰。

為此,IHPA 引入了螞蟻在內部大規模彈性生產實踐中打磨出的一套基于機器學習的預測式算法,該算法首先通過 Swish Net for Time Series Forecasting (SNTSF) 對潛在影響應用容量水位的多條流量進行時序預測,隨后通過 Linear-Residual Model 將這些組分流量和應用容量及其對應副本數進行綜合建模,最終推理得出應用未來的推薦副本數。

通過這種流量驅動容量的思想,該算法能夠很好地應對生產上多周期流量、趨勢變化流量、多條流量共同影響容量、容量與副本數呈非線性關系等復雜場景,通用性和準確性兼具。

不同于原生 HPA 只支持工作負載擴縮容,IHPA 支持在整個彈性過程中精細化地控制工作負載下每一個 Pod 的狀態,通過靈活的 Pod 狀態轉換提升彈性效率并降低彈性風險。

目前,Kapacity 中定義了下面幾種 Pod 狀態:

Online:Pod 正常對外提供服務的狀態 (Running and Ready) ,也是新擴容 Pod 的默認狀態。 Cutoff:Pod 流量完全摘除的狀態 (Running but Not Ready) 。在實踐上,支持優先縮容到此狀態,并輔以一段穩定性觀察期,一旦發現問題能夠秒級回滾到 Online 狀態。 Standby:Pod 資源被換出,保持在低水位的狀態。相比于 Cutoff 狀態,該狀態能夠實際釋放 Pod 所占用資源供其他應用使用,也支持分鐘級回滾到 Online 狀態。 Deleted:Pod 被真正刪除的狀態。實際到了該狀態 Pod 本身就不存在了。

另外,通過上述不同狀態的組合和轉換可以實現更多玩法,比如螞蟻內部的大規模分時調度技術、熱池技術等就是基于多級彈性的實踐。

IHPA 吸收了螞蟻多年大規模彈性生產實踐的經驗教訓,沉淀出了獨有的彈性變更穩定性保障能力。

IHPA 在執行擴縮容時支持采用自定義灰度分批的變更策略,最大程度地減小了彈性變更的爆炸半徑;同時還支持加入上文提到的 Cutoff/Standby 中間態實現多階段灰度,提升應急回滾速度,進一步降低彈性變更風險。

下面以使用 Cutoff 作為中間態的一次灰度縮容為例:某應用的工作負載原來有 6 個 Pod,期望縮容到 2 個,此時會按照用戶的灰度配置自動分批變更 Pod 為 Cutoff 狀態,每次變更都會間隔一定時間進行穩定性觀察。當待縮容 Pod 都切換為 Cutoff 狀態后會進入最終的額外穩定性觀察期,如果最后沒有發現風險則再執行真正的縮容,如果期間發現風險,則能夠快速回滾到 Online 狀態。

在彈性變更的過程中,有時候僅僅通過觀察彈性指標是否異常無法及時暴露出風險,因此,IHPA 支持用戶自定義的變更期穩定性檢查,包括自定義指標異常判斷等,多維度地分析變更狀況,一旦發現異常支持自動采取應急熔斷措施,如變更暫停或變更回滾,真正做到彈性變更常態化無人值守。

Kapacity 在項目設計之初就極度關注模塊化與擴展性,比如整個 IHPA 能力就拆分為了管控、決策、執行三大模塊,任一模塊都可以做替換或擴展,其中可擴展的部分包括但不限于:

可自定義生成應用水平畫像 (目標副本數) 的具體算法以及算法所依賴的指標、參數等 可擴展多級彈性支持的工作負載、自定義 Pod 狀態切換的邏輯等 可自定義變更期穩定性檢查邏輯 可自定義 Pod 縮容的優先級 (對于支持的工作負載) ……

借助其高度可擴展定制的特性,用戶可以很輕松地將 Kapacity 和其他開源上下游方案或者內部自建系統結合使用,各取所需、各取所長,極大提升了項目的適用廣度。

現狀和未來

Kapacity 項目開源伊始,當前還處于早期的快速功能迭代階段,目前發布的 版本主要包含多級彈性、灰度變更等部分精細化彈性能力,以及基本的定時與響應式擴縮容算法。

在預計 6 月份發布的 版本中,我們會將上文提到的預測式智能彈性算法開放出來。

后續我們會繼續優先補齊 IHPA 彈性的各項基礎能力,包括:

流量突增識別算法 穩定性檢查和變更熔斷能力 更完善的自定義指標支持

未來,我們也會陸續開源螞蟻在云原生容量領域沉淀的其他技術,以及更多高階能力,比如:

保活切換 (Standby 狀態) 和分時調度能力 基于智能算法的 Pod 資源規格 (CPU、內存等) 推薦與 VPA 能力 支持多維度成本與碳排放計算的可視化控制臺 ......

歡迎大家關注我們持續更新的 RoadMap 了解更多詳細規劃。

/zh-cn/docs/roadmap

加入我們

我們致力于將 Kapacity 項目打造為一個開放包容、有創造力的社區,后續的研發與討論等工作都會以開源的形式在社區透明進行。歡迎任何形式的參與,包括但不限于提問、代碼貢獻、技術討論等。非常期待收到大家的想法和反饋,一起參與到項目的建設中來,推動項目健康向前發展,打造最先進的云原生容量技術。

歡迎各種 issue、PR、Discussion,項目主倉庫的 GitHub 地址為:

/traas-stack/kapacity

相關稿件

焦點熱門:螞蟻集團云原生智能容量技術 KapacityStack 正式開源

許家印騎虎難下:恒大汽車,生產或停產,都是兩難

提升資金效益,廣州黃埔出臺“財政高質量發展12條”

巴媒列有資格參加2025世俱杯的32支球隊:曼城、皇馬、切爾西在內

扶不起的阿斗現實生活 扶不起的阿斗

全球快報:外資銀行開戶條件

專項債發行流程_天天報道

海底真的有美人魚嗎_海底里有美人魚嗎-快播報

醫藥生物行業2023中期策略:深挖國改、節奏復蘇、精選中藥、重視爆款、底部拐點

滴滴:端午休閑娛樂訂單較節前增長80%

天天微速訊:填志愿,怎樣看待專業“冷熱”

世界看熱訊:遠域懾阻 協同作戰!東部戰區空軍航空兵出擊

看廣告就有收益?廣告電商模式

江南華南仍有大范圍強降水 華北黃淮等地高溫天氣持續-熱訊

每日熱點:失戀后,十二星座怎樣忘記對方,天秤座痛哭,你呢

金筆點龍txt(金筆點龍這書的來歷?)_焦點快看

環球時訊:分手之后,再相愛也很難再回頭的三大星座

畢業旅行“課本游”人氣旺

北京海關前5月查獲進境瀕危動植物及其制品7800余件

廣東高考6月25日放榜!如何查詢成績&填報志愿?請收好這份指南

海通國際給予雙箭股份優于大市評級,國內輸送帶龍頭企業,產能擴張發揮規模優勢

范正辭_關于范正辭的簡介-今日熱搜

微速訊:大橡塑股吧-大橡塑股票改名

前沿資訊!急性支氣管炎的癥狀和治療方法有哪些圖片_急性支氣管炎的癥狀和治療方法有哪些

每日動態!英語輔導頻道藍鴿樂園(藍鴿英語學習網址是什么)

每日快報!守望先鋒為什么叫守望py(守望先鋒為什么叫屁股游戲 看看這些圖就知道了)

山東黃金集團推廣開展典型案例解剖式調研、“代入式”調研經驗做法_全球快訊

什么叫背靠背協議(什么是背靠背協議)

浙江發布嘉興水文站洪水紅色預警|天天聚看點

山東省第三批殘疾兒童少年隨班就讀示范區示范校名單公示 全球看熱訊


主站蜘蛛池模板: 亚洲欧美日韩精品久久久| 在线视频不卡一区二区| 久久在线中文字幕| 欧美日韩免费精品| 国产精品精品久久久久久| 久久天堂国产精品| 日本不卡一区二区三区在线观看 | 国产精品亚洲天堂| 久久在线中文字幕| 欧美激情国产精品| 欧美中文字幕视频在线观看| 亚洲人成网站在线播放2019| 91久久久久久久久久| 高清国产一区| 99久久国产免费免费| 国产成人亚洲综合91| 国产又粗又长又爽视频| 久久久久久久有限公司| 欧美在线日韩精品| 欧美在线日韩在线| 欧美激情网友自拍| 男人的天堂99| 精品一区久久久| 久久精品99久久久久久久久| 欧美二区在线| 欧美尤物巨大精品爽| 欧美日韩999| 久久久久久久久综合| 久久精品国产v日韩v亚洲| 久久久久久久久久久av| 久久精品一本久久99精品| 欧美激情精品久久久久久蜜臀| 欧美婷婷久久| 久久久久免费精品| 精品久久蜜桃| 国产福利精品在线| 丝袜美腿亚洲一区二区| 日本不卡久久| 久久久久高清| 国产精品久久久久久久久久东京| 国产精品美女999|