微信掃一掃
關(guān)注北京致公
訂閱號
微信掃一掃
關(guān)注中國致公
訂閱號
今年的政府工作報告明確提出,要“培育壯大新興產(chǎn)業(yè)和未來產(chǎn)業(yè)”,建立未來產(chǎn)業(yè)投入增長和風(fēng)險分擔(dān)機制,培育發(fā)展未來能源、量子科技、具身智能、腦機接口、6G等未來產(chǎn)業(yè)。這是“具身智能”連續(xù)第二年被寫入政府工作報告。 過去一年,具身智能創(chuàng)業(yè)公司不斷涌現(xiàn),頭部互聯(lián)網(wǎng)公司、芯片公司和新能源汽車公司也紛紛加入具身智能“戰(zhàn)場”,越來越多風(fēng)險投資也注入該賽道。具身智能產(chǎn)業(yè)加速從技術(shù)研發(fā)走向規(guī)?;涞?,2025年前三季度,工業(yè)機器人產(chǎn)量達59.5萬臺,服務(wù)機器人產(chǎn)量達1350萬套,均超過2024年全年產(chǎn)量。 未來哪些技術(shù)突破可能為具身智能產(chǎn)業(yè)化按下加速鍵?具身智能的人才缺口如何補?以及面對急劇變化的人工智能產(chǎn)業(yè),高校與計算機專業(yè)的學(xué)生應(yīng)該如何應(yīng)對?對于這些問題,全國政協(xié)委員、中國科學(xué)院自動化研究所多模態(tài)人工智能系統(tǒng)全國重點實驗室副主任王亮接受了《中國報道》記者專訪,分享了他對具身智能產(chǎn)業(yè)的洞察。
全國政協(xié)委員王亮 “我對這個領(lǐng)域的前景是非常樂觀的,但產(chǎn)業(yè)化會是一個漸進的過程,把基礎(chǔ)打扎實比急于追求短期成果可能更為重要?!蓖趿琳f。 身在高校,王亮特別強調(diào)產(chǎn)教融合的重要性。他認為,對具身智能來說,高校與產(chǎn)業(yè)的深度融合不是可選項,而是學(xué)科本身的內(nèi)在要求。具身智能的研究對象是在真實物理環(huán)境中工作的智能系統(tǒng),學(xué)生如果接觸不到真實的硬件平臺和工程約束,研究就很難具備實際價值。 以下為《中國報道》與王亮的對話實錄,有刪減。 技術(shù)突破的三把鑰匙:大模型、世界模型、軟硬協(xié)同 《中國報道》:不少網(wǎng)友調(diào)侃,今年“機器人全面入侵春晚”,宇樹科技、?魔法原子、?銀河通用和?松延動力4家公司的人形機器人高調(diào)亮相春晚。與此同時,馬斯克也反復(fù)在社交媒體向公眾和投資者宣揚,特斯拉公司的人形機器人“擎天柱”將在明年顛覆現(xiàn)狀,并有望創(chuàng)造一個新的巨型產(chǎn)業(yè)。具身智能產(chǎn)業(yè)在多方因素作用下超預(yù)期進化,您如何判斷具身智能未來的發(fā)展方向?哪些技術(shù)突破可能會對加速具身智能的產(chǎn)業(yè)化進程起到關(guān)鍵作用? 王亮:從我自己的研究實踐出發(fā),我認為具身智能正處在從“能力驗證”走向“場景落地”的轉(zhuǎn)折點。學(xué)術(shù)界已經(jīng)在一些受控環(huán)境下證明了智能體可以完成相當(dāng)復(fù)雜的任務(wù),但從實驗室到真實場景之間還有較大的距離需要跨越。未來的核心挑戰(zhàn),不僅要讓機器人更聰明,還要讓它能在真實復(fù)雜、不斷變化的環(huán)境中可靠地工作。 從技術(shù)突破的角度,我認為有幾個方向的進展對具身智能產(chǎn)業(yè)化非常關(guān)鍵。第一是以大模型為基礎(chǔ)的通用感知和決策能力。過去我們?yōu)槊總€任務(wù)訓(xùn)練專用模型,泛化能力很差,換一個場景就要重新來過?,F(xiàn)在借助視覺語言模型等新范式,智能體開始具備跨場景、跨任務(wù)的泛化潛力,一旦這個方向取得實質(zhì)突破,具身智能的應(yīng)用邊界會極大拓寬。 第二是世界模型與物理理解能力。機器人要在真實環(huán)境中可靠地工作,必須對物理世界有基本的預(yù)測能力:理解物體的材質(zhì)、重量、運動趨勢等。這方面的進展將直接提升系統(tǒng)在復(fù)雜場景中的安全性和可靠性。
World Labs產(chǎn)品界面。圖源/網(wǎng)絡(luò) (注:登上《時代》雜志2025年度封面人物、人工智能先驅(qū)之一的華人科學(xué)家李飛飛于2024年創(chuàng)立World Labs,致力于“世界模型”的研發(fā)。用戶使用該模型,僅靠一張圖、一句話,就能生成一個完整3D世界。) 第三是軟硬件的協(xié)同設(shè)計。算法的能力上限很大程度上取決于硬件的設(shè)計,反過來算法的進展也應(yīng)該驅(qū)動硬件迭代。真正能落地的產(chǎn)品,一定是兩者深度耦合的結(jié)果。 我對具身智能發(fā)展前景的看法是非常樂觀的,但產(chǎn)業(yè)化是一個循序漸進的過程,把基礎(chǔ)打扎實比急于追求短期成果可能更為重要。 人才瓶頸:縱向打不通,橫向鋪不開 《中國報道》:雖然具身智能的產(chǎn)業(yè)規(guī)模在加速擴張,有望在2035年突破萬億元。但數(shù)據(jù)顯示,具身智能行業(yè)正面臨著嚴峻的復(fù)合型技術(shù)人才短缺問題,甚至出現(xiàn)了百萬年薪難解具身智能“人才荒”的局面。獵聘大數(shù)據(jù)研究院發(fā)布的《2025三季度人才供需洞察報告》顯示,具身智能平均招聘年薪高達33.34萬元,明顯高于人工智能行業(yè)的29.09萬元。北京理工大學(xué)表示,根據(jù)調(diào)研,當(dāng)前各行業(yè)和單位具身智能人才缺口約100萬。根據(jù)您的觀察和研究,當(dāng)前具身智能領(lǐng)域的人才缺口和困局體現(xiàn)在哪些方面? 王亮:人才問題是我在教學(xué)和研究中感受非常直接的瓶頸問題。個人認為可以從兩個維度來理解。一個是縱向的技術(shù)深度,也就是軟硬件貫通的能力。傳統(tǒng)AI人才的培養(yǎng)大多在純數(shù)字環(huán)境中完成,但具身智能要求算法最終落在真實的物理實體上運行?,F(xiàn)實情況是,做算法的同學(xué)往往缺乏對硬件約束的體感,做硬件的同學(xué)對最新AI技術(shù)又不夠熟悉,能在這條鏈條上貫通的人非常稀缺。 另一個是橫向的場景寬度,也就是技術(shù)與行業(yè)深度結(jié)合的能力。具身智能的價值要在制造、醫(yī)療、家庭服務(wù)等具體行業(yè)中兌現(xiàn),但每個行業(yè)都有獨特的流程邏輯和安全規(guī)范。缺乏對行業(yè)縱深的理解,技術(shù)方案往往只能停留在“能演示”的階段,很難真正通過客戶的驗收。這類復(fù)合型人才成長周期長,很難完全靠校內(nèi)培養(yǎng)完成。這兩個維度的人才缺口是相互關(guān)聯(lián)的:縱向打不通,技術(shù)出不了實驗室;橫向鋪不開,產(chǎn)品進不了行業(yè)。 《中國報道》:為加快適應(yīng)產(chǎn)業(yè)發(fā)展,不少高校近一年增設(shè)“具身智能”專業(yè)。2025年,教育部陸續(xù)公布了申請增設(shè)“具身智能”“具身智能工程”新專業(yè)的9所高校,其中包括北京航空航天大學(xué)、北京理工大學(xué)、上海交通大學(xué)等。其中,上海交通大學(xué)設(shè)立具身智能四年制工學(xué)本科專業(yè),依托人工智能學(xué)院計算機類學(xué)科體系。從人才培養(yǎng)角度來看,具身智能與人工智能在知識體系構(gòu)建和能力要求上有哪些共通之處?又有哪些本質(zhì)上的不同? 王亮:二者在數(shù)理基礎(chǔ)、編程能力、深度學(xué)習(xí)等核心理論與方法上都是共享的,二者的核心差異在于思維模式的轉(zhuǎn)變。人工智能的思維習(xí)慣是“數(shù)據(jù)進、數(shù)據(jù)出”,關(guān)注離線指標(biāo)的表現(xiàn);具身智能則要求學(xué)生時刻意識到算法在真實物理世界中運行,每一個決策都有物理后果,很多時候不可逆。這種從“信息空間思維”到“物理空間思維”的跨越,僅靠課堂講授很難完成,需要學(xué)生在真實的硬件系統(tǒng)中反復(fù)歷練。 圍繞真實工程問題來組織教學(xué),推動產(chǎn)教深度融合
《中國報道》:面對巨大的產(chǎn)業(yè)需求,高校在具身智能人才培養(yǎng)上應(yīng)做出哪些調(diào)整? 王亮:我認為具身智能的人才培養(yǎng)不能簡單地在現(xiàn)有AI課程體系上做加法,而是要圍繞真實的工程問題來組織教學(xué),讓學(xué)生在解決問題的過程中自然地整合不同學(xué)科的知識。 高校應(yīng)通過構(gòu)建跨學(xué)科的培養(yǎng)體系,讓學(xué)生形成復(fù)合型的知識結(jié)構(gòu);強化學(xué)生的工程實踐能力,為學(xué)生提供更多接觸真實具身智能體硬件和實際工程問題的機會,而不僅僅停留在仿真和論文層面;注重人才梯隊的合理建設(shè),如本碩博貫通式教育,既要培養(yǎng)能做原始創(chuàng)新的研究型人才,也要培養(yǎng)能把技術(shù)落到實處的工程應(yīng)用型人才。 尤其在推動產(chǎn)教融合方面,對具身智能來說,高校與產(chǎn)業(yè)的深度融合不是可選項,而是學(xué)科本身的內(nèi)在要求。 從我的觀察來看,很多校企合作僅僅停留在企業(yè)出資、高校出論文的階段,雙方在問題定義上并沒有真正對齊,有效的合作應(yīng)該是圍繞真實的技術(shù)瓶頸共同攻關(guān)。 要讓學(xué)生有實質(zhì)性進入產(chǎn)業(yè)場景的機會,不是參觀式的實習(xí),而是深度參與到工程項目的完整周期中。這種經(jīng)歷對學(xué)生的成長價值,遠超課堂上的模擬訓(xùn)練。具身智能的研究對象是在真實物理環(huán)境中工作的智能系統(tǒng),學(xué)生如果接觸不到真實的硬件平臺和工程約束,研究就很難具備實際價值。 此外,在人才培養(yǎng)環(huán)節(jié),高校要更加注重激發(fā)年輕人的問題意識和獨立思考能力,讓他們不僅善于跟進學(xué)科前沿,更有勇氣去定義新的基礎(chǔ)問題。在具身智能領(lǐng)域,我們在應(yīng)用層面積累的大量真實場景經(jīng)驗,實際上正在催生很多新的基礎(chǔ)研究問題,這是我們未來提升原始創(chuàng)新能力和攻關(guān)關(guān)鍵核心技術(shù)的優(yōu)勢所在。 找到能力“錨點”,持續(xù)深耕 《中國報道》:從大語言模型到如今的具身智能,AI領(lǐng)域的技術(shù)熱點快速迭代,各類模型與產(chǎn)品層出不窮。您觀察到身邊的學(xué)生面對人工智能工具的快速迭代,是否存在心態(tài)上的焦慮或壓力?這種背景下,雖然我們強調(diào)持續(xù)學(xué)習(xí)的重要性,但在計算機相關(guān)專業(yè)中,是否存在一些能力的“常量”及相對穩(wěn)定的核心素養(yǎng)?對于學(xué)生如何適應(yīng)一個AI工具不斷涌現(xiàn)的時代,您有何建議? 王亮:坦率地講,焦慮和壓力是存在的。大語言模型興起之后,不少同學(xué)發(fā)現(xiàn)自己精心設(shè)計的模型和方法,可能被一個通用大模型直接覆蓋掉了。過去需要專門訓(xùn)練才能解決的任務(wù),現(xiàn)在通過提示詞就能完成。 到了具身智能階段,類似的焦慮也在發(fā)生,同學(xué)們會擔(dān)心自己當(dāng)前的研究方法很快被新范式替代。一個博士生的培養(yǎng)周期一般是五年,但一個技術(shù)范式的更迭有時只需要一兩年,有時甚至更快,這種節(jié)奏上的錯配,是焦慮的重要來源。 但我經(jīng)常跟學(xué)生講,焦慮的根源往往不是技術(shù)變化本身,而是對自身能力“錨點”的不確定。如果核心競爭力建立在某個特定框架或模型上,確實容易被沖擊;但如果建立在更深層的基礎(chǔ)之上,情況可能就完全不同。 所以我認為教育中確實存在需要堅守的“內(nèi)核”。第一是扎實的數(shù)理基礎(chǔ)。我經(jīng)常跟學(xué)生分享一個現(xiàn)象:每一輪看似全新的技術(shù)浪潮,當(dāng)你沉下心去研究其最核心的論文時會發(fā)現(xiàn),底層撬動問題的杠桿仍然是經(jīng)典的數(shù)學(xué)工具。數(shù)理功底扎實的學(xué)生面對新范式時,適應(yīng)速度遠快于只熟悉特定工具的同學(xué)。 第二是科研方法和能力的訓(xùn)練?,F(xiàn)在很多學(xué)生能熟練調(diào)用開源模型、復(fù)現(xiàn)論文算法,但在獨立定義問題、設(shè)計實驗、分析實驗失敗原因等方面仍存在不足。我常對學(xué)生說,一個實驗跑出了好的數(shù)字不代表你理解了它為什么好,一個方法失敗了也不代表這個方向沒有價值,關(guān)鍵在于能不能嚴謹?shù)胤治龊万炞C。 第三是對真實應(yīng)用場景的理解力。我鼓勵學(xué)生多去實際應(yīng)用場景中看一看,了解真實的需求和瓶頸問題,這種經(jīng)驗是看多少論文都替代不了的。 在技術(shù)快速迭代的當(dāng)下,我的建議是,要把AI工具當(dāng)作能力的放大器而不是替代品,用大模型輔助工作沒有問題,但前提是你自己要有判斷質(zhì)量的能力。同時,要有定力在一個方向上持續(xù)深耕。真正做出有影響力研究的年輕學(xué)者,往往不是追熱點的人,而是在一個問題上深耕數(shù)年、建立起系統(tǒng)性認知的人。 此外,關(guān)注國家在具身智能、人形機器人等方向上的戰(zhàn)略部署,把個人的研究興趣與真實的產(chǎn)業(yè)需求結(jié)合起來,這樣研究的價值根基會更扎實,發(fā)展方向也會更清晰。 (來源:中國報道 原標(biāo)題:向新而行|具身智能再被寫入政府工作報告,人才培養(yǎng)如何跟上?) |