具身智能:步入AI舞臺中央?

訊石光通訊網(wǎng) 2024/5/26 14:26:52

  ICC訊 近日,一段視頻在網(wǎng)上熱傳。視頻中,初創(chuàng)公司Figure的人形機器人外表和動作都與人類十分相似。它可以與人流暢對話,理解人的意圖。聽到工程師“想吃點東西”的口令后,它遲疑了一下,準確地拿起了蘋果。它甚至可以解釋自己為什么要這樣做。

北京市中關(guān)村展示中心常設(shè)展上的人形機器人。 視覺中國供圖

  這一人形機器人背后,是OpenAI公司為其配置的大語言模型。多模態(tài)技術(shù)加持下,它具備高級視覺和語言智能。

  隨著大模型、機器人制造等技術(shù)發(fā)展,賦予人工智能“形體”的具身智能(Embodied AI)正逐步走入人工智能舞臺中央。

  具身智能是人工智能產(chǎn)業(yè)發(fā)展的重要方向之一。英偉達近期發(fā)布人形機器人通用基礎(chǔ)模型Project GR00T,希望能讓機器人擁有更聰明的“大腦”。由Project GR00T驅(qū)動的機器人能夠理解自然語言,并通過觀察人類行為來模仿人類動作。在特斯拉2023股東大會上,馬斯克也向大眾展示了人形機器人Optimus的全新型號。這些都是具身智能駛?cè)氚l(fā)展快車道的縮影。

  AI技術(shù)的集大成者

  1950年,圖靈在他的一篇論文中首次提出了具身智能的概念。

  “具身智能是人工智能的一個重要分支,它強調(diào)智能體與其所處的物理環(huán)境緊密交互,通過人形機器人等智能實體實現(xiàn)感知、決策和行動。”賽迪顧問人工智能與大數(shù)據(jù)研究中心常務(wù)副總經(jīng)理鄒德寶向科技日報記者介紹,“這種結(jié)合讓人工智能可通過攝像頭、傳感器等理解環(huán)境,并通過機械臂、輪子等執(zhí)行器作用于物理世界,在物理空間中學習、適應并完成指令任務(wù)?!?

  這是一個包含人工智能幾乎所有技術(shù)的領(lǐng)域,可以說是AI的集大成者。

  “要充分發(fā)揮人工智能的強大能力,就要將其‘附身’于實體——機器人,這一行為被稱為‘具身’。”達闥機器人創(chuàng)始人、首席執(zhí)行官黃曉慶說。

  在他看來,從生物學角度,人類是自然選擇的產(chǎn)物,因此具備通用性的終極機器形態(tài)應與人類相同;從功能性角度,要使機器人能替代人類執(zhí)行所有任務(wù),其形態(tài)需與人類相似;從人工智能發(fā)展角度,訓練大模型需要大量數(shù)據(jù),而人類語言、行為、智能等數(shù)據(jù)信息無疑最豐富,人形機器人因此能最大限度獲取訓練數(shù)據(jù)。

  “通過為人工智能系統(tǒng)賦予形體,我們可以使其與人類用戶之間的交互更直觀、自然和便捷。形體也可以幫助人工智能系統(tǒng)更好地感知和理解現(xiàn)實世界?!编u德寶說,具有形體的人工智能系統(tǒng)可以應用于更多領(lǐng)域,特別是在需要與人類進行密切協(xié)作的場景中。例如,在醫(yī)療領(lǐng)域,一個具有實體形態(tài)的人工智能機器人可以協(xié)助醫(yī)生進行手術(shù)操作。

  技術(shù)進步和挑戰(zhàn)并存

  依托大規(guī)模數(shù)據(jù)和強大算力的大模型,為機器理解世界提供了前所未有的能力。它與具身智能的結(jié)合,預示著機器人的未來將更加智能化、互動化。

  去年11月,工業(yè)和信息化部印發(fā)《人形機器人創(chuàng)新發(fā)展指導意見》,提出人形機器人集成人工智能、高端制造、新材料等先進技術(shù),發(fā)展?jié)摿Υ?、應用前景廣,是未來產(chǎn)業(yè)的新賽道。

  鄒德寶談到,發(fā)展具身智能,主要可從三方面發(fā)力。一是仿生機制。具身智能的一個關(guān)鍵目標是使機器能像生物體一樣具備感知、決策和運動能力。因此,更深入地研究和模仿復雜的生物機制,如神經(jīng)系統(tǒng)的運行方式、生物體的自我修復能力等,是實現(xiàn)這一目標的重要途徑。二是基于物理的智能決策能力。智能系統(tǒng)需要更緊密地與其所處的物理形態(tài)融合,以便在各種環(huán)境中自然、高效地執(zhí)行任務(wù)。這意味著需要發(fā)展出更先進的機器人硬件和軟件技術(shù),支持智能系統(tǒng)在復雜環(huán)境中的運動和操作。三是自主學習和適應環(huán)境。具身智能系統(tǒng)需要具備自主學習和適應環(huán)境能力,以便能在復雜多變的環(huán)境中執(zhí)行任務(wù)和解決問題。這可以通過強化學習、遷移學習等機器學習技術(shù)實現(xiàn)。

  技術(shù)突飛猛進之下,具身智能市場活躍。頭部廠商不僅在技術(shù)研發(fā)上取得顯著進展,還在商業(yè)應用和拓展市場方面取得了突破。特斯拉宣布,其旗下擎天柱人形機器人的首個商業(yè)化場景將是自家公司汽車生產(chǎn)車間。人形機器人(上海)有限公司聯(lián)合行業(yè)頭部企業(yè)成立的新型研發(fā)機構(gòu),致力于建設(shè)貫穿創(chuàng)新鏈、產(chǎn)業(yè)鏈、資金鏈和人才鏈的人形機器人創(chuàng)新生態(tài)系統(tǒng)。聯(lián)想創(chuàng)投作為聯(lián)想集團旗下的全球科技產(chǎn)業(yè)基金,通過投資和支持具身智能技術(shù)公司,推動該技術(shù)的商業(yè)化應用。

  然而,難題和挑戰(zhàn)也如影隨形。

  首當其沖的是算力。具身智能需要進行大量計算來支持感知、決策和運動過程。隨著任務(wù)和環(huán)境復雜性的升級,其對算力的需求會不斷增加。

  數(shù)據(jù)安全也不可忽視。具身智能系統(tǒng)需要收集和處理大量數(shù)據(jù)進行學習優(yōu)化,這些數(shù)據(jù)可能包含用戶個人隱私信息。

  “隨著具身智能技術(shù)不斷發(fā)展,我們也需要關(guān)注其可能帶來的倫理和道德問題。例如,如何確保機器人在執(zhí)行任務(wù)時不傷害人類或造成不必要的損失,如何保證機器人行為符合人類道德和價值觀等?!编u德寶說。

  未來人工智能發(fā)展的重要方向

  英偉達創(chuàng)始人兼CEO黃仁勛曾表示,人工智能發(fā)展的下一個浪潮是具身智能,是能理解、推理、并與物理世界互動的智能系統(tǒng)。

  “具身智能對人工智能產(chǎn)業(yè)發(fā)展意義重大,對實現(xiàn)AGI(通用人工智能)具有不可忽視的價值?!编u德寶認為,從當前技術(shù)趨勢和市場動態(tài)來看,具身智能極有可能成為人工智能發(fā)展的下一個重要方向。

  首先,具身智能強調(diào)智能體與真實世界的交互。這種交互性不僅增強了人工智能系統(tǒng)的實用性,還促進了人工智能技術(shù)在各個領(lǐng)域的應用。具身智能是實現(xiàn)AGI的關(guān)鍵之一。AGI需要能像人類一樣理解并適應各種物理環(huán)境和各種復雜任務(wù),而具身智能正是通過讓智能體與物理環(huán)境進行實時交互和響應,實現(xiàn)對環(huán)境的感知和理解。因此,具身智能的發(fā)展將為實現(xiàn)AGI提供重要技術(shù)支持。

  從當前技術(shù)發(fā)展趨勢來看,具身智能已成為人工智能領(lǐng)域研究熱點。隨著深度學習、強化學習和遷移學習等技術(shù)的不斷進步以及機器人硬件的日益成熟,具身智能已具備一定技術(shù)基礎(chǔ)。同時,應用市場對具有可交互性的智能系統(tǒng)的需求也在不斷增長,這為具身智能發(fā)展提供了廣闊市場。

  針對發(fā)展具身智能可能面臨的風險,鄒德寶建議,要通過優(yōu)化算法、提高硬件性能等方式不斷提升計算能力,滿足具身智能對計算資源的需求。采用加密技術(shù)、數(shù)據(jù)脫敏等手段保護用戶數(shù)據(jù)安全和隱私,同時制定嚴格的數(shù)據(jù)使用和共享政策,確保用戶數(shù)據(jù)不會被濫用或泄露。此外,也要制定具身智能技術(shù)倫理和道德準則,并加強對具身智能技術(shù)的監(jiān)管和評估,確保其行為符合人類道德和價值觀。

新聞來源:科技日報

相關(guān)文章