近期,科技界迎來了一則令人矚目的消息:Figure公司宣布與Open AI的合作終止,并預告將在接下來的30天內推出一項人形機器人領域的創新技術。這一預告迅速引發了廣泛的好奇與期待。
終于,Figure揭開了神秘面紗,推出了其自主研發的具身模型Helix,并將其首次應用于Figure機器人中。據Figure創始人兼CEO Brett Adcock介紹,搭載了Helix“大腦”的機器人,能夠輕松拾取各種家庭物品。
在一則展示視頻中,兩臺Figure機器人正協同工作,一臺桌子和一臺冰箱旁,它們將各種未見過的物品分類整理得井井有條,動作流暢且高效。尤其是兩臺機器人在傳遞物品時默契的對視,讓眾多網友驚嘆不已,仿佛機器人擁有了某種意識。
這一切得益于Helix對機器人上半身的全控制,包括手腕、軀干、頭部和各個手指,實現了高速率的連續控制。視頻還罕見地展示了多機器人之間的協作,盡管這次的任務相對簡單,但多機協作的交互和規劃無疑是未來機器人技術的一個重要課題。
在具體任務執行上,Figure表示,只需向機器人發出指令,它便能拾起各種從未見過的家庭用品,如玩具、杯子等。這一能力得益于Helix強大的泛化能力。
Helix是一個集感知、語言理解和學習控制于一體的“視覺-語言-感知”(VLA)模型,實現了多項首創。它不僅能控制機器人上半身進行高速連續動作,還能實現多機器人協作,解決共享的遠程操作任務。同時,只需按照自然語言提示,就能拿起幾乎任何小型家居物品,包括數千種從未遇到過的物品。
更令人驚嘆的是,Helix使用一組神經網絡權重來學習所有行為,無需針對特定任務進行微調。這意味著,機器人能夠靈活應對各種任務,無需進行額外的訓練或編程。Helix還是首款完全在嵌入式低功耗GPU上運行的VLA,具備立即進行商業部署的條件。
在機器人上半身的控制上,Helix能以200Hz的頻率協調35個自由度的動作空間,實現手指、手腕到頭部的流暢高效動作。視頻中,機器人用頭部平穩地跟蹤雙手,同時調整軀干以獲得最佳范圍,同時保持精確的手指控制以抓握物品。這種程度的實施協調和多任務泛化能力,在此前的VLA中還未曾見過。
Figure還展示了Helix在高難度多智能體操作場景中的應用:兩臺Figure機器人之間協作實現零樣本雜貨存放。兩臺機器人采用相同的Helix模型權重進行操作,無需訓練或分配角色,就能通過自然語言進行合作。這種能力使得機器人在非結構化環境中的部署成為可能。
Brett Adcock表示,團隊花費了一年多的時間研發出了Helix,讓人形機器人無需經過任何訓練或代碼,就能抓取幾乎任何家庭用品。這一創新技術無疑為機器人領域帶來了新的突破和可能性。