4 月 25 日至 26 日,東南大學鯤鵬 N 騰科教創(chuàng)新孵化中心特訓營(第一期)在九龍湖校區(qū)成功舉辦。本次活動由東南大學鯤鵬 N 騰科教創(chuàng)新孵化中心主辦,江蘇鯤鵬·N 騰生態(tài)創(chuàng)新中心、東南大學網(wǎng)絡與信息中心承辦,圍繞 N 騰 AI 基礎軟硬件解決方案、大模型訓練與推理技術、DeepSeek 架構(gòu)解析及邊緣部署等核心議題,通過課程培訓和實戰(zhàn)演練共 2 天的培訓營,為東南大學計算機及相關專業(yè)本碩博生提供了一個深度技術交流平臺;顒又荚谕苿踊邛H鵬 N 騰底座的人才生態(tài)建設,加速國產(chǎn)化 AI 技術在高校科研與產(chǎn)業(yè)應用中的落地。
N 騰 AI 全棧技術:軟硬協(xié)同賦能大模型落地
N 騰產(chǎn)品線專家楊越洋在首日課程中,系統(tǒng)性地介紹了針對大模型訓推場景的 N 騰 AI 基礎軟硬件解決方案。他提出大模型從預訓練走向了預訓練+后訓練,推理部署從單機走向集群,創(chuàng)新迭代速度加快,其中 N 騰 AI 軟硬件技術提供全場景技術支撐。硬件層面,N 騰 Atlas 全系服務器支持高帶寬點對點通信、液冷一體化設計與盲插運維,可覆蓋中心訓練、邊緣推理及大規(guī)模專家并行(EP)部署場景,同時異構(gòu)計算架構(gòu) CANN 提供算子、通信等底層技術;軟件層面,MindSpore 框架、MindSpeed 訓練加速庫、MindIE 推理引擎及 MindStudio 全流程工具鏈,顯著提升模型開發(fā)效率。楊越洋強調(diào),N 騰通過軟硬協(xié)同設計,已為企業(yè)級大模型訓練、微調(diào)及行業(yè)應用提供了高性能、高可用的技術底座。
MindSpeed 加速庫:突破大模型訓練瓶頸
MindSpeed 研發(fā)專家劉哲續(xù)從算法、算力與數(shù)據(jù)三大維度剖析了大模型發(fā)展的趨勢與挑戰(zhàn),并強調(diào)加速套件是算力需求激增下的重點研究課題。期間他介紹了業(yè)界加速套件的現(xiàn)狀并重點解析了 MindSpeed 的技術架構(gòu):底層依托 N 騰 NPU 算力,通過通信優(yōu)化、內(nèi)存優(yōu)化(參數(shù)副本壓縮、激活重計算)、計算優(yōu)化(親和改寫,計算融合)、并行優(yōu)化(Swap、融合長序列、NoopLayer 負載均衡)等技術,實現(xiàn)訓練效率躍升。最后介紹了 MindSpeed LLM、MM、RL 共三大套件。其中,LLM 針對大語言模型,支持多預制模型并提供全流程工具;MM 聚焦動模態(tài)模型,模塊化組件,主打高性能與模塊化;RL 可支持強化學習部署,提供全流程強化學習能力。
國產(chǎn)化實踐:從模型對齊到多模態(tài)開發(fā)
N 騰計算工程師雷珍珍和程麟勝,分享了 MindSpeed 在大模型領域成果。雷珍珍介紹,MindSpeed 基于 N 騰生態(tài)打造分布式訓練框架,能對主流大模型高效訓練與微調(diào)。她還解析模型開發(fā)七大步驟,強調(diào)確保與開源框架訓練結(jié)果一致的關鍵要點,并分享性能優(yōu)化策略。程麟勝提到,