第四范式推出基于持久內存、支持毫秒級恢復的萬億維線上預估系統
        2021-02-19

        線上預估服務是AI在企業應用落地的關鍵環節,企業通常會采用分布式計算架構在內存中完成實時數據處理和高達萬億維的模型特征存儲,并通過多集群副本解決傳統純內存(DRAM)天生的易“失”性隱患,以達到線上實時服務質量(Quality of Service)效果。然而,隨著企業AI應用模型大小和數量的增長,線上預估服務所需要的硬件資源也呈幾何倍數增加。


        為進一步滿足企業線上預估需求,第四范式定制開發了基于持久內存技術、支持實時恢復的萬億維線上預估系統,為企業提供高可用性、毫秒級恢復的在線預估服務,同時將企業總擁有成本降低80%。該系統基于第四范式AI算力平臺SageOne的持久內存進行了軟硬一體設計,與其他預估系統相比,可實現每秒億級KV查詢的高性能,并能夠與第四范式自研的高維機器學習框架以及TensorFlow等AI開源框架無縫對接。保證了在線預估服務無論在發生物理故障或者程序崩潰的情況下,均具備毫秒級故障實時恢復特性,是企業低成本實現高可用AI線上預估服務的最佳選擇。


        第四范式自研的基于持久內存的萬億維級參數服務器 –HyperPS是該線上預估系統的關鍵基礎組件。HyperPS參數服務器具備高性能底層序列化框架、鏈路共享、多級訪存優化、雙端參數合并及動態擴縮容等特性?;诔志脙却嬖O計和優化后,HyperPS在保持與基于純內存參數服務器幾乎一致性能的同時,展現出在線上預估應用中數據實時恢復和應用成本低的巨大優勢。


        持久內存加持 參數服務器性能升級


        參數服務器通常將所有數據放在純內存中處理,AI模型越大,分布式參數服務器的內存需求越大。此外,純內存雖然性能優秀,但因其易失性(volatile)特性,一旦硬件或者軟件發生故障,內存丟失的全部數據必須從持久性存儲設備(HDD/SSD)中讀取日志恢復,恢復速度慢,嚴重影響線上性能服務質量。


        持久內存的大容量、高性能、非易失性屬性,為其帶來了高安全性、低成本等優勢,改善了目前純內存容量小、成本高、災備恢復慢等問題。針對持久內存這些應用優點,第四范式針對HyperPS參數服務器的底層系統架構和存取性能等進行了軟硬一體設計。首先,針對節點內的shard重新設計了新的存儲引擎,采用持久化哈希表為底層數據結構儲存特征,保證高并行度性能的同時,對持久內存數據組織格式進行優化,達到接近于純內存哈希表的性能;其次,對參數服務器災難恢復機制調優,使用持久化智能指針記錄哈希表的核心數據結構和根指針,實現業界首創的參數服務器實時恢復能力;再次,利用PMDK的transaction機制,使用pmempool分配和管理持久內存空間,確保持久內存數據一致性;最后,針對影響性能的持久化操作進行策略性的降低,進一步提高性能。


        在實際測試環境中,基于持久內存的HyperPS表現出更低的擁有成本和巨大的實時恢復優勢,以及與純內存近乎一致的性能表現。


        01. 企業AI應用內存預估:


        AI為企業帶來出眾的業務效果,同時企業也要承擔AI產生的成本壓力,特別是當AI規模化應用時。以某著名手機終端廠商為例,分別采用配備384GB 純內存服務器和配備2TB持久內存的服務器為預估單節點基準。每上線一個模型在在純內存的參數服務器上占用內存空間大概是128GB。基于持久內存的數據結構由于其有額外的持久化邏輯,在空間復雜度上會略高于純內存數據結構,其空間占用大概是204GB。在此基礎上,估算企業上線1-100個模型參數服務器所需的純內存物理節點數和配備持久內存的物理節點數量。


        第四范式推出基于持久內存、支持毫秒級恢復的萬億維線上預估系統圖1


        從預估結果來看,企業需要采用持久內存的物理節點數量和純內存的物理節點數量比為1:3.4-4,而持久內存的參數服務器總成本最多下降80%。


        02. 數據恢復速度測試:


        當系統節點出現故障時,采用純內存的參數服務器需要從數據存儲集群(如HDFS)重新申請模型參數數據恢復,耗時長,嚴重影響線上服務質量。采用持久內存的HyperPS則完全不同,節點發生故障或者程序崩潰后,數據依然保存在持久內存中,服務重啟后只需要調用優化過的數據一致性檢查函數,即可實現毫秒級實時恢復。


        第四范式推出基于持久內存、支持毫秒級恢復的萬億維線上預估系統圖2

        以恢復6千萬維參數模型為例,純內存參數服務器恢復模型需要花費58秒,而持久性內存參數服務器只需要0.03秒,故障恢復時長縮短將近2000倍。


        第四范式推出基于持久內存、支持毫秒級恢復的萬億維線上預估系統圖3

        恢復20個模型總計12億維參數測試中,純內存參數服務器數據恢復時間隨著數據總量增加而大幅增長,而持久內存的參數服務器幾乎沒有受到影響,只需檢查哈希表元數據后即可提供服務,其恢復時長縮短17114倍。


        03. 預估性能測試:


        HyperPS不僅大幅降低了總擁有成本并提升數據恢復速度,也展現出和純內存模式下同水準的性能表現。在非高壓(1個請求線程)和高壓(56個并發請求線程)的情況下的請求延遲(TP99)。結果表明,基于持久內存的HyperPS參數服務器在延遲上,與采用純內存的參數服務器性能相近。單線程和56線程兩個測試中,持久內存的參數服務器均僅比采用純內存的參數服務器延遲多1毫秒。


        在吞吐性能對比測試項目中,基于持久內存的參數服務器在56線程的高壓負載測試中的QPS僅比純內存參數服務器低3.5%。


        此次,通過 “軟件定義算力”的全新方式,第四范式將自研HyperPS萬億維參數服務器與英特爾?傲騰?持久內存進行軟硬一體優化設計,保證線上推理服務超高性能的同時,大幅降低企業AI整體投入成本,提升線上服務質量,進一步掃清了企業AI規?;瘧玫那斑M障礙。


        招聘

        平臺技術團隊熱招崗位


        AI數據庫技術專家

        大數據技術專家

        C++/Java/Python/Golang研發工程師

        前端資深研發工程師


        第四范式平臺技術團隊承載著業界首個低門檻、端到端的AI平臺“第四范式先知”的研發攻堅重任,為人工智能在不同行業的規?;瘧锰峁└咝阅?、高可用、高擴展的底層軟硬件架構。歡迎志同道合的小伙伴加入,投遞簡歷至:talent@4Paradigm.com。





        主站蜘蛛池模板: 赣州市| 河津市| 双流县| 隆化县| 通州区| 浏阳市| 侯马市| 蒲江县| 乌什县| 建平县| 呼玛县| 定安县| 互助| 普陀区| 即墨市| 广水市| 苍南县| 海阳市| 哈尔滨市| 绍兴县| 称多县| 开远市| 曲靖市| 瑞丽市| 岑溪市| 安阳县| 达尔| 西昌市| 塔河县| 射洪县| 韶山市| 藁城市| 荣成市| 平遥县| 万盛区| 车致| 都安| 大港区| 绍兴县| 安丘市| 清远市|