2023伊始,先是開年毫末智行舉辦HAOMOAIDAY,放出自動駕駛行業最大智算中心,再有小鵬、理想新春全員信劍指城市導航輔助駕駛,隨後是對話式AI大模型ChatGPT火遍全網,自動駕駛AI技術再次成為頂流。
無論是自動駕駛的“進城”,還是ChatGPT的“進化”,其背後都是對數據、算力需求指數級增長的態勢以及對大模型的訓練。當需求上來了,智算中心作為自動駕駛的“新基建”也就被業界越來越多的提及。
智算中心即智能計算中心,是基於人工智能理論,采用領先的AI計算架構,提供人工智能應用所需算力服務、數據服務和算法服務的公***算力新型基礎設施,換句話說,智算中心其實是壹個算力的供應和生產平臺。那為什麽有了它“自動輔助駕駛”就可以變為“自動駕駛”了?
“降服”自動駕駛邊際成本 自動駕駛智算中心“專雲專用”
有人說,智算中心是自動駕駛發展的助推器,因為自動駕駛算法模型訓練是機器學習的典型場景之壹,其視覺檢測、軌跡預測與行車規劃等算法模型需要同時完成高並發的並行計算,對算力有著極高的需求,而智算為提高算法模型的成熟度提供了巨大的算力。
在自動駕駛領域,說起智算中心,還得先提特斯拉。2017年,Transformer網絡出現後,奠定了當前大模型領域主流的算法架構基礎,隨後,2020年,特斯拉將Transformer大模型引入自動駕駛領域中,是AI大模型應用於自動駕駛的開端。在這之後,特斯拉開始著手打造屬於自己的AI計算中心——Dojo,總計使用了1.4萬個英偉達的GPU來訓練AI模型。為了進壹步提升效率,特斯拉在2021年發布了自研的AI加速芯片D1,並計劃將25個D1封裝在壹起組成壹個訓練模塊(Training tile),然後再將訓練模塊組成壹個機櫃(Dojo ExaPOD)。最近壹期的特斯拉AI DAY上,馬斯克稱將於2023年壹季度部署完成特斯拉超級計算機群組ExaPOD。
國內方面,2022年8月,小鵬汽車和阿裏雲合建了當時國內最大的自動駕駛智算中心“扶搖”,專門用於自動駕駛模型訓練,算力規模達600PFLOPS,相當於每秒可以完成60億億次浮點運算。不過這個記錄僅僅維持了4個多月。
今年1月,毫末智行聯合火山引擎,***同推出自動駕駛行業最大的智算中心MANA OASIS(雪湖·綠洲),每秒浮點運算達67億億次,存儲帶寬每秒2T,通信帶寬每秒800G。吉利也在1月28日上線了吉利星睿智算中心,目前已接入智能駕駛和車聯網實驗數據近百PB,在線車輛的並發計算支持達百萬輛。
從現有情形來看,成本和需求兩重因素,是智算中心的誘人之處。
成本層面,算力作為自動駕駛的基本要素,需要更高性能的智算中心來完成訓練、標註等工作。以毫末的MANA OASIS為例,通過部署Lego高性能算子庫、ByteCCL通信優化能力,以及大模型訓練框架,軟硬壹體,毫末把算力優化到極致。在訓練效率方面,基於Sparse MoE,通過跨機***享,輕松完成千億參數大模型訓練,且百萬個clips(毫末視頻最小標註單位)訓練成本只需百卡周級別,訓練成本降低100倍。
搭建高效、低成本的數據智能體系是自動駕駛技術健康發展的基礎,也是自動駕駛系統能夠不斷叠代前行的重要環節,更是自動駕駛商業化閉環的關鍵所在。
小鵬汽車董事長何小鵬曾表態,“如果現在不以這樣的方式(智算中心)提前儲備算力,那麽今後5年內,企業算力成本會從億級,加到數十億級。”
如果持續使用公有雲服務,邊際成本不斷上漲只是壹方面,更重要的是,智算中心可以讓自動駕駛企業實現“專雲專用”。自動駕駛的開發包括從數據采集到數據篩選、打標、模型訓練、回放性驗證、仿真測試等等環節。而雲計算的本質是租賃計算設備,雲服務商的設備都是統壹采購,為了獲得更多客戶,這些設備都具備很大的通用性,設備內部使用的CPU、GPU/AI加速器、內存的型號與規格都相對固定,很難與車企和自動駕駛公司的算法形成最佳匹配。並且,雲服務廠商對自動駕駛算法的了解程度不高,不可避免的會在調度算力時出現損耗和效率不高的問題。所以,從需求的角度來看,智算中心似乎可以成為自動駕駛和車企的托底神器。
同樣以毫末為例,有了MANA OASIS的加持,毫末MANA五大模型全新亮相升級,車端感知架構實現跨代升級,毫末的技術棧布局繼續保持完整領先的態勢,尤其在感知、認知等層面領跑行業,引領大模型、大算力、大數據發展方向,沖刺進入自動駕駛3.0時代。
拿數據采集、篩選和標註來說,自動駕駛系統在前期開發階段,需要采集大量的道路環境數據,以此讓車輛像人類駕駛員壹樣快速準確地識別車道、行人、障礙物等駕駛環境中的關鍵信息。唯壹的辦法是,通過在海量數據基礎上不斷的重復訓練與驗證,車輛對道路環境的認知水平逐漸趨近於真實情景,判斷的準確性在這壹過程中不斷提升。
不僅如此,車企收集到的數據還需要進行模型訓練,算法通過在數據上進行運算產生模型,而智算中心將是驅動大模型和海量數據訓練的加速器。基於Sparse MoE,毫末根據計算特點,進行稀疏激活,提高計算效率,實現單機8卡就能訓練百億參數大模型的效果,實現跨機***享exper的方法,完成千億參數規模大模型的訓練,訓練成本降低到百卡周級別;毫末設計並實現了業界領先的多任務並行訓練系統,能同時處理圖片、點雲、結構化文本等多種模態的信息,既保證了模型的稀疏性、又提升了計算效率;MANA OASIS訓練效率提升了100倍。
毫末智行CEO顧維灝也在詳細闡釋了建設智算中心的底層邏輯:“自動駕駛對智算中心的第壹要求肯定是算力。智算中心的超大算力代表了有多少的AI工程師在這個練武場中能夠做出什麽大模型,能訓練多少大模型。”
智能輔助駕駛“進城” MANA OASIS幫助毫末解決了哪些難題?
現在很多車企和自動駕駛技術企業已經開始把打造智算中心當成下壹階段競爭重點。今年1月的HAOMO AI DAY上,毫末智行董事長張凱給出了2023年自動駕駛行業趨勢的十大新預測,超算中心赫然位列其中,“超算中心會成為自動駕駛企業的入門配置。”
事實上,當下,隨著新能源汽車品牌普遍已經把高速公路場景下的輔助駕駛列為標配,賽場已經悄然從高速路轉向城市。與高速導航輔助駕駛相比,城市行車涉及了紅綠燈、十字路口、行人電動車、遮擋、固定障礙物、頻繁剎停起步等壹系列難題,復雜度又提升了好幾個數量級。
如果僅用實測車輛去挑戰這些城市場景無法窮盡的Corner Case,成本、安全性、時間都將成為企業發展的壁壘。由此,虛擬仿真就成為了解決部分成本及場景多樣性的關鍵,其中,大規模的長尾場景需要數據中心提供充足的算力支持。同時,仿真場景對現實的回歸過程,同樣需要巨大的算力提供支持。
在MANA OASIS的加持下,毫末的數據智能體系MANA五大模型全新亮相升級。而在五大模型助力下,MANA最新的車端感知架構,從過去分散的多個下遊任務集成到了壹起,形成壹個更加端到端的架構,包括通用障礙物識別、局部路網、行為預測等任務,毫末車端感知架構實現了跨代升級。這也意味著毫末的感知能力更強,產品力更強,向全無人駕駛加速邁進。
首先是視覺自監督大模型,讓毫末在中國首個實現4D Clip的自動標註。毫末利用海量videoclip,通過視頻自監督方式,預訓練出壹個大模型,用少量人工標註好的clip數據進行Finetune(微調),訓練檢測跟蹤模型,使得模型具備自動標註的能力;然後,將已經標註好的千萬級單幀數據所對應的原始視頻提取出來組織成clip,其中10%是標註幀,90%是未標註幀,再將這些clip輸入到模型,完成對90%未標註幀的自動標註,進而實現所有單幀標註向clip標註的100%的自動轉化,同時降低98%的clip標註成本。毫末視頻自監督大模型的泛化性效果極佳,即使是在壹些非常困難的場景,例如嚴重遮擋的騎行者,遠處的小目標,惡劣的天氣和光照,都能準確地完成自動標註。
其次是3D重建大模型,助力毫末做數據生成,用更低成本解決數據分布問題,提升感知效果。面對“完全從真實數據中積累corner case困難且昂貴”的行業難題,毫末將NeRF技術應用在自動駕駛場景重建和數據生成中,它通過改變視角、光照、紋理材質的方法,生成高真實感數據,實現以低成本獲取normal case,生成各種高成本corner case。3D重建大模型生成的數據,不僅比傳統的人工顯式建模再渲染紋理的方法效果更好、成本更低。增加NeRF生成的數據後,還可將感知的錯誤率降低30%以上,且數據生成可實現全程自動化,無需任何人工參與。
多模態互監督大模型則可以完成通用障礙物的識別。毫末在成功實現車道線和常見障礙物的精準檢測後,針對城市多種異形障礙物的穩定檢測問題,毫末正在思考和探索更加通用的解決方案。目前,毫末的多模態互監督大模型,引入了激光雷達作為視覺監督信號,直接使用視頻數據來推理場景的通用結構表達。該通用結構的檢測,可以很好地補充已有的語義障礙物檢測,有效提升自動駕駛系統在城市復雜工況下的通過率。
動態環境大模型,可以精準預測道路的拓撲關系,讓車輛始終行駛在正確的車道中。在重感知技術路線下,毫末為了將對高精地圖的依賴度降到最低,面臨著“道路拓撲結構實時推斷”的挑戰。為此,毫末在BEV的feature map(特征圖)基礎上,以標精地圖作為引導信息,使用自回歸編解碼網絡,將BEV特征,解碼為結構化的拓撲點序列,實現車道拓撲預測。讓毫末的感知能力,能像人類壹樣在標準地圖的導航提示下,就可以實現對道路拓撲結構的實時推斷。
毫末認為,解決了路口問題實際就解決了大部分城市NOH問題。目前在保定、北京,毫末對於85%的路口的拓撲推斷準確率高達95%。即便是非常復雜、非常不規則的路口,毫末也能準確預測,比老司機還老司機。
人駕自監督認知大模型在今年2月已經被正式升級為DriveGPT,這也是全球首個自動駕駛認知大模型。它能讓毫末的駕駛策略更加擬人化,安全及順暢。目前,毫末DriveGPT已完成模型搭建和第壹階段數據的跑通,參數規模可對標GPT-2的水平。接下來,DriveGPT將持續引入大規模真實接管數據,通過人駕數據反饋的強化學習,來不斷提升測評效果,同時也將DriveGPT作為雲端測評模型,用來評估車端小模型的駕駛效果。
仿真測試能有效縮短技術和產品開發周期,降低研發成本。業內典型的長尾場景問題不夠豐富,現實中可遇而不可求的極端場景,利用仿真平臺可以便捷生成。由於仿真測試中的模擬環境需要實現多模態融合,以支持傳感器模組的復雜性,因而也需要大算力的支持。
除了毫末,特斯拉超算中心擁有近2萬張GPU,對自動駕駛訓練效率產生立竿見影的效果,最大限度地提升了自動駕駛系統的開發效率;大陸集團的高算力集群,將開發周期從幾周縮短至幾個小時,使自動駕駛得以在中短期商業計劃中落實;機器學習時間的縮短加快了新科技進入市場的速度;“扶搖”支持小鵬自動駕駛核心模型的訓練時長從7天縮短至1小時內,大幅提速近170倍……
當前,壹個不爭的事實就是,在自動駕駛領域具有長期規劃的車企,無論是造車新勢力還是傳統品牌,或者技術供應商,都在搭建自己的超算中心,以掌握穩定的算力資源,縮短開發周期,加快自動駕駛產品的上市。相反,如果沒有超算中心,那麽自動駕駛訓練速度將明顯放緩,自動駕駛企業間的差距也將愈發明顯。
用智算中心打造數據護城河 數字新基建逐步成為發展“標配”
自動駕駛發展至今,業界發現乘用車智能輔助駕駛是最有可能大規模鋪開的商業場景。據高工智能汽車研究院數據顯示,2022年中國市場(不含進出口)乘用車前裝標配搭載L2級輔助駕駛的搭載率,已經連續第二個月超過30%。智研咨詢數據顯示,預計到2025年,全球新車L2自動駕駛的滲透率可達53.99%。
今年,城市導航輔助駕駛也開啟了量產的征程。西部證券預測,2023~2025年,國內市場上搭載城市導航輔助駕駛的車型將分別達到70萬、169萬和348萬輛,占比將分別達到17%、40%和70%。
在城市導航輔助駕駛落地加速的背景下,更容易復制、拓展的重感知的方案,受到了更多關註。在重感知技術路線下,面對“道路拓撲結構實時推斷”的挑戰,毫末的選擇是在特征圖基礎上,以標精地圖作為引導信息,使用自回歸編解碼網絡,通過結構化的拓撲點序列解碼,實現車道拓撲預測。由此不難看出,業界逐漸達成***識的重感知路線,相比高精地圖方案,更依賴算力加持。
人工智能是創新的加速器,智算中心則可以為各類技術創新提供支撐。壹方面,智算中心可以為構建安全可信、可復用的技術研發環境提供算力設施支撐,為各領域科技研發提供智能計算服務,加速科技研發的進程;另壹方面,智算中心是新壹代信息技術的集成應用載體,智算中心的快速建設推廣與規模化應用將推動通信服務網絡、大數據、人工智能等技術的快速叠代,從而促進技術創新。自動駕駛數據是片段式的,特點是小文件多,達到百億個,而且訓練需要交換的數據多,智算中心可以提供充足的帶寬,並且可以讓自動駕駛模型擁有更好的並行計算框架,在訓練的時候把硬件資源都利用起來。
2020年4月20日,國家發展改革委首次明確新型基礎設施的範圍,其中就包括以智能計算中心為代表的算力基礎設施。2023年1月10日,國家工業信息安全發展研究中心推出《智能計算中心2.0時代展望報告》,指出經過5年多發展,智算中心正由1.0粗放擴張階段走向2.0精細規劃階段。
根據相關統計和測算,目前全國超過30個城市在建或籌建智算中心,未來5年我國智能算力規模年復合增長率將達52.3%。智算中心的創新發展,將進壹步為人工智能夯實“算力底座”,成為帶動人工智能及相關產業快速發展的新引擎。
“我們測算,智算中心帶來的成本優化是驚人的,將達到億元級別。”這是今年1月,張凱提出的預測。從目前及未來的規劃量產規模來看,毫末自建智算中心可節約巨額成本;同時,其帶來的效率提升也非常明顯。
人工智能發展很快,新的算法層出不窮,需盡快引入新的技術和模型,與此同時,數據是智能化發展最大的驅動力,也占據了大量成本構成。用自建智算中心來打造數據護城河,不僅能夠完善產業智能生態,更能讓企業在智能化方面占據先發優勢,智算中心作為數字新基建,未來勢必將引領自動駕駛技術持續叠代升級。
本文來自易車號作者車業視界,版權歸作者所有,任何形式轉載請聯系作者。內容僅代表作者觀點,與易車無關