生成式人工智能(GenAI)和大語(yǔ)言模型(LLM)的發(fā)展帶來(lái)了巨大的算力需求,數(shù)據(jù)中心的能源消耗也因此大幅增加。Gartner 預(yù)測(cè),到 2027 年,新增 AI 服務(wù)器所需的用電量將是 2023 年的兩倍以上,這給數(shù)據(jù)中心運(yùn)營(yíng)帶來(lái)了多方面的挑戰(zhàn)。首先,不斷攀升的電力需求導(dǎo)致運(yùn)營(yíng)成本上升。為了滿足 GenAI 對(duì)電力的需求,數(shù)據(jù)中心需要更多的能源供應(yīng),這將增加電力成本。其次,電力消耗的增加也會(huì)影響數(shù)據(jù)中心的性能,可能導(dǎo)致服務(wù)器過(guò)熱、網(wǎng)絡(luò)延遲等問題。此外,過(guò)度的電力消耗還對(duì)環(huán)境造成負(fù)面影響,不符合可持續(xù)發(fā)展的要求。為了應(yīng)對(duì)這些挑戰(zhàn),一些企業(yè)開始將 GenAI 處理向終端設(shè)備轉(zhuǎn)移。將更多的 AI 推理工作負(fù)載轉(zhuǎn)移至終端設(shè)備,可以減輕數(shù)據(jù)中心的電力壓力,同時(shí)提高響應(yīng)速度和數(shù)據(jù)隱私保護(hù)水平。Gartner 預(yù)測(cè),到 2026 年,終端 GenAI 查詢量將超過(guò)云端,這標(biāo)志著 AI 戰(zhàn)略的重大轉(zhuǎn)向。然而,終端 GenAI 處理也需要重新設(shè)計(jì)關(guān)鍵技術(shù)。由于終端設(shè)備的外形尺寸限制,其搭載的 GenAI 處理需要極高的能源效率,同時(shí)不能影響終端設(shè)備的續(xù)航時(shí)間和電池壽命。這就需要在半導(dǎo)體、電池以及 AI 模型開發(fā)領(lǐng)域進(jìn)行顯著的協(xié)同創(chuàng)新。在半導(dǎo)體方面,高效節(jié)能芯片是實(shí)現(xiàn)實(shí)時(shí)處理和低延遲的關(guān)鍵。專為終端 GenAI 設(shè)計(jì)的專用 AI 處理器、低功耗存儲(chǔ)芯片,以及集成 NPU 的應(yīng)用處理器和 MCU 成為首選方案。此外,氮化鎵等寬禁帶半導(dǎo)體在快充電源轉(zhuǎn)換中也起著重要作用。在電池方面,更高能量密度的固態(tài)鋰離子電池將成為支持終端 GenAI 處理的關(guān)鍵。這些電池可以提供更長(zhǎng)的續(xù)航時(shí)間,確保終端設(shè)備在 GenAI 處理過(guò)程中不會(huì)很快耗盡電量。在 AI 模型方面,終端設(shè)備需要參數(shù)規(guī)模更小的定制化 AI 模型。這些輕量化的大語(yǔ)言模型適用于特定任務(wù)和行業(yè),可以降低計(jì)算需求,使其適合部署在資源有限的終端設(shè)備上。綜上所述,GenAI 和 LLM 的迅猛發(fā)展帶來(lái)了前所未有的算力需求,對(duì)數(shù)據(jù)中心的電力供應(yīng)造成了巨大壓力。將 GenAI 處理向終端設(shè)備轉(zhuǎn)移是一種應(yīng)對(duì)策略,但需要在半導(dǎo)體、電池和 AI 模型等領(lǐng)域進(jìn)行創(chuàng)新,以滿足終端設(shè)備對(duì)高效能、低功耗的需求。這一轉(zhuǎn)變將對(duì) AI 行業(yè)的未來(lái)發(fā)展產(chǎn)生深遠(yuǎn)影響。