時(shí)隔7年,中央政治局近期再次圍繞人工智能進(jìn)行集體學(xué)習。
作為引領(lǐng)新一輪科技革命和產(chǎn)業(yè)變革的戰略性技術(shù),人工智能正深刻改變人類(lèi)生產(chǎn)生活方式。近年來(lái),通過(guò)完善頂層設計、加強工作部署,我國人工智能綜合實(shí)力實(shí)現整體性、系統性躍升,但在基礎理論、關(guān)鍵核心技術(shù)等方面還存在不少短板弱項。
基礎研究依然薄弱
要在人工智能領(lǐng)域占領(lǐng)先機、贏(yíng)得優(yōu)勢,必須在基礎理論、方法、工具等方面取得突破。
“當前,人工智能已進(jìn)入一個(gè)新的階段——物理AI時(shí)代,競爭愈發(fā)聚焦于‘根技術(shù)’?;A理論、方法、工具等方面的突破,是贏(yíng)得競爭優(yōu)勢的關(guān)鍵,這就好比為高樓打地基,地基打得牢,大廈才能建得高?!鄙虾K蓱萍加邢薰綜EO聶凱旋表示。
什么是“根技術(shù)”?如今爆火的大語(yǔ)言模型ChatGPT的核心架構——Transformer就屬于“根技術(shù)”。2017年6月,隨著(zhù)一篇論文的發(fā)表,Transformer走進(jìn)了大眾視野,很快成為自然語(yǔ)言處理和計算機視覺(jué)領(lǐng)域在有監督學(xué)習設置下的主流神經(jīng)架構。盡管其在生成式任務(wù)中表現十分優(yōu)異,但隨著(zhù)時(shí)間推移,局限性逐漸顯現。
高階微分計算能力不足、科學(xué)推理能力欠缺、可解釋性與穩定性缺失……“要突破這些瓶頸,構建適應科學(xué)計算需求的下一代主流架構,必須回歸到統計學(xué)習、數學(xué)逼近論等數理基礎理論層面尋求創(chuàng )新?!敝袊茖W(xué)院自動(dòng)化研究所副研究員王闖說(shuō)。
基礎研究是整個(gè)科學(xué)體系的源頭,是所有技術(shù)問(wèn)題的總機關(guān)?!霸绞侨斯ぶ悄苌蠈?,我國研究者對世界作出的貢獻越多;越是底層,我國研究者的貢獻越少?!敝袊茖W(xué)院計算技術(shù)研究所研究員陳云霽曾在一篇文章中指出。
“卡脖子”風(fēng)險仍舊存在
目前來(lái)看,我國在人工智能領(lǐng)域除應用層面具備一定的差異化競爭優(yōu)勢外,諸多關(guān)鍵核心技術(shù)仍面臨著(zhù)“卡脖子”風(fēng)險。
一個(gè)典型代表就是人工智能芯片。數據、算力、算法是AI的三大基石,共同構成了技術(shù)發(fā)展的底層支撐。作為算力的物理載體,以GPU(圖形處理器)、FPGA(現場(chǎng)可編程門(mén)陣列)和ASIC(專(zhuān)用集成電路)為代表的人工智能芯片,是人工智能技術(shù)發(fā)展的核心硬件,決定了大模型訓練效率、推理速度及系統實(shí)時(shí)性。
王闖告訴記者,經(jīng)過(guò)近幾年發(fā)展,國產(chǎn)GPU芯片基本實(shí)現了進(jìn)口替代,但整體性能與全球人工智能芯片GPU的領(lǐng)導廠(chǎng)商英偉達相比仍有較大差距。例如,在大模型訓練端,國產(chǎn)芯片整體計算效率較英偉達最先進(jìn)芯片性能落后約3年。
另一個(gè)代表是算法。人工智能算法包括基礎算法和應用算法兩種類(lèi)型。專(zhuān)家指出,目前幾乎全部的基礎算法模型都由美國大學(xué)、IT公司提出,應用算法多數開(kāi)源,并且美國各大公司是人工智能開(kāi)源代碼的主要貢獻者,對大部分開(kāi)源社區有絕對控制權。
龐大的大數據樣本和卓越的算力平臺基礎設施是人工智能大模型訓練的基礎?!爱斍?,我國人工智能軟件存在嚴重的數據孤島問(wèn)題,且高端數據匱乏?!甭檮P旋說(shuō)。
不過(guò),相較于上述掣肘,王闖更擔憂(yōu)的是國外企業(yè)對應用生態(tài)的壟斷。當前,AI模型的分發(fā)與共享高度依賴(lài)少數全球化平臺,這種壟斷帶來(lái)的后果是,即使中國研發(fā)出頂尖大模型,仍需依賴(lài)國際平臺推廣,從而在標準制定、技術(shù)趨勢上喪失話(huà)語(yǔ)權?!斑@種壟斷,或將形成比硬件或算法更加隱蔽卻更深遠的控制力?!蓖蹶J認為,國內頭部企業(yè)應協(xié)同打造真正開(kāi)放的開(kāi)源平臺。
系統部署刻不容緩
加強人工智能基礎研究,時(shí)不我待?!叭斯ぶ悄艿拿恳淮畏睒s都離不開(kāi)基礎理論的重大突破,人工智能架構面臨的問(wèn)題,同樣需要從理論層面尋求解答?!蓖蹶J建議,國家層面進(jìn)一步加大對人工智能數學(xué)機理、數學(xué)基礎理論、計算機基礎理論等基礎研究的支持力度。
在聶凱旋看來(lái),物理AI時(shí)代,人工智能基礎研究主要聚焦兩大核心方向——物理世界建模能力與機器人智能體系構建,這些突破將重塑產(chǎn)業(yè)競爭格局。例如,協(xié)作機器人抓取雞蛋時(shí),需要同步計算接觸力與蛋殼強度,這類(lèi)“手腦協(xié)同”能力高度依賴(lài)高保真物理仿真。松應科技自主研發(fā)的國內首款物理AI仿真系統ORCA,成功解決了這一難題。
需要迎頭趕上的不只是基礎研究,還要將人工智能大模型發(fā)展的主動(dòng)權牢牢掌握在自己手中。有學(xué)者建議,著(zhù)力攻克關(guān)鍵底層技術(shù),實(shí)現從芯片設計到訓練框架的全鏈條自主可控;優(yōu)化異構算力調度能力,降低萬(wàn)卡集群訓練能耗與成本;堅持“學(xué)中干,干中學(xué)”,培育理論功底厚、工程能力強的高端人才隊伍。
“從基礎理論到基礎硬件平臺、核心軟件,每一項突破都需要不斷積累經(jīng)驗?!蓖蹶J說(shuō),我們既要集中力量打好關(guān)鍵核心技術(shù)攻堅戰,也要努力構建具有國際影響力的人工智能創(chuàng )新生態(tài),同時(shí)加快推動(dòng)更多人工智能成果從“書(shū)架”走向“貨架”。
“物理AI時(shí)代,未來(lái)人工智能的關(guān)鍵突破將集中在3個(gè)深度融合實(shí)體世界的領(lǐng)域?!甭檮P旋認為,搶占未來(lái)人工智能發(fā)展的先機,需從三方面著(zhù)手布局:筑牢物理AI自主基座,支持企業(yè)構建硬件中立平臺,將其納入“新基建”重點(diǎn)部署;構建開(kāi)源協(xié)同生態(tài),聯(lián)合成立“物理AI開(kāi)源聯(lián)盟”,推動(dòng)中國主導的數據標準國際化;打造場(chǎng)景驅動(dòng)試驗田,在低空經(jīng)濟、智慧物流等領(lǐng)域設立國家級先導區,通過(guò)稅收優(yōu)惠等政策推動(dòng)國產(chǎn)平臺規?;瘧?,形成可復制的“數字孿生+實(shí)體經(jīng)濟”的模式。(經(jīng)濟日報記者 沈 慧)