爱看影院,天美传媒97a∨,天堂av,国产精品免费大片

宇樹機器人到底強不強?深度解讀具身智能都有哪些流派?
2025-06-15 14:39

宇樹機器人到底強不強?深度解讀具身智能都有哪些流派?

本文來自微信公眾號:腦放電波 (ID:BrainAMP),作者:腦放電波,題圖來自:unitree

文章摘要
宇樹機器人實際商業化呈現反差:表面銷量亮眼,但核心產品完成度低,消費者版為L1級遙控玩具,主力客戶是租賃/表演市場;創始人王興興非精英背景,依托中國供應鏈和時機創立宇樹,以垂直整合能力提供低成本高性能硬件運動平臺;具身智能技術分六大流派,當前真實水平多在L1-L2級,VLA模型有潛力但受制于高質量數據瓶頸。

? ??三層反差:銷量光環下,產品本質為遙控玩具與工業粗造零件,科研與租賃為主場景。

? ??租賃主力:高價人形機用于商業活動租賃“撐場面”,稀缺性因產能擴大消退。

? ??創始人特質:“土碩”王興興依托中國供應鏈紅利與逆向工程思維,實現硬件成本突破。

? ??技術定位:非全自主智能體,本質是開放的高性能運動平臺,降低全球科研門檻。

? ??評級標準:參考自動駕駛L1-L5劃分,行業頭部也僅處L2向L3過渡演示階段。

? ??數據瓶頸:VLA模型等前沿路線最大障礙是高質量多模態數據缺失與標準化困難。

宇樹科技無疑是今年科技圈最炙手可熱的名字之一,它的火爆甚至點燃了整個人形機器人賽道,但喧囂之下,不同的聲音開始浮現。在北京人形機器人馬拉松、央視機器人搏擊賽中,人形機器人跌倒、遙控的現象也印證了技術距離成熟應用的差距——這個領域存在著類似“買家秀與賣家秀”的巨大反差。


這篇文章的觀點,主要提煉自科技播客“腦放電波”與資深硬件黑客Rex的對談。你可以在主流播客、視頻平臺找到這些內容。我們將試圖回答以下幾個核心問題:


  • 宇樹的產品為何部分從業者甚至自家員工都“不推薦”?它的機器人究竟賣給了誰?實際商業化基本盤如何?


  • 為什么宇樹這樣的公司注定誕生在中國?“土碩”王興興和宇樹少為人知的發展歷程是怎樣的?宇樹的技術到底屬于哪個流派?


  • 不同具身智能技術流派,真實表現到底如何?怎樣一眼看穿其中的“水分”?


一、銷售、產品、應用三層反差:誰在為宇樹機器人買單?


創始人王興興宣稱其機器狗占據全球超60%市場份額,人形機器人銷量同樣領先。一個細節是:某段時間,宇樹那臺售價近兩萬元的機器狗,竟然沖上了京東機器人銷量榜第二名,榜單上其他產品,幾乎全是售價不過千元的兒童玩具。


相反,如果你嘗試與宇樹團隊進行溝通,感受會截然不同。



最直接的反差來自宇樹內部的“預期管理”。當我們嘗試聯系一位負責對外溝通的員工了解產品細節時,微信加上第一時間就發來一份詳盡的“避坑指南”,直白且主動地管理著潛在買家的預期:


  • 產品定位清晰切割:售價9.99萬的G1人形機器人標準版?“不支持二次開發,只能用來展示和玩具”,本質就是個遙控貨。真正面向科研、高校和開發者的G1 EDU版,價格跳到20萬~40萬元。想要完整的行業解決方案?加上配件、服務器、定制開發,請準備好一兩百萬元。


  • 技術落地坦誠相告:工廠物流、迎賓接待這些熱門咨詢場景(據說半年接到5000多個咨詢電話)目前做技術儲備可以,實用化還有好些年”。這位員工甚至給出了個人判斷的時間表:穩定性可靠性,2026年6月后;±5cm精準導航,2026~2028年;復雜的手眼協調抓取,得等到2028~2034年;至于機器人大模型和復雜環境理解,普遍指向2028~2030年。


  • 核心價值聚焦“本體”:宇樹現階段賣的就是“機器人的本體”,提供開發資料,你自己評估,或者找第三方開發。“暫時不承接人形機器人的定制化開發”。


這種坦誠,一面是市場熱度反復“拷問”后的直接反應,另一面也揭示了宇樹現階段的商業本質——提供一個硬件平臺,而非打包好的解決方案。


另一個反差在于炫酷演示與“創客級”現實的脫節。公眾看到的宇樹機器人能跑能跳還能后空翻,酷炫十足。但深入到實際體驗和產品細節,距離“精致完善”還有相當長的路。


在科技播客“腦放電波”組織的一場線下活動中,40位參與者體驗G1人形機器人消費者版,只有10人表示“符合預期”。


多數人的失望點在于:它本質上還是個遙控玩具,運動時噪音和地面接觸聲也偏大。此外,宇樹還有零部件產品線——電機、機械臂、激光雷達等,單獨賣給開發者和創客。這些零件的產品精致度和服務,同樣停留在“創客級”。


我們的節目嘉賓Rex曾經在宇樹官方旗艦店購買電機時遭遇漏發貨,客服竟回應稱“需要去倉庫看一看才知道有沒有庫存”,這與主流電商的服務標準相去甚遠。產品細節處理也相當粗獷,控制電路板僅用一個透明熱縮管包裹做絕緣,缺乏標準工業包裝,觀感“如同大學生為了打比賽手搓的板子”。


官方開發文檔更是極度簡化,電機代碼庫只有一個范例,還沒有注釋,命名方式也相當隨意。所以,無論是整機還是零件,宇樹當前的產品完成度、精致度和服務,更像一個面向開發者和早期愛好者的“高級套件供應商”,而非工業級或消費級成熟產品公司。


既然消費者版體驗有落差,那賣出去的機器狗和人形機器人,到底誰在用?科研教育是基本盤,但近半年宇樹真正“出圈”,靠的是消費者版。這些機器人的主要用途集中在租賃和表演上。


科技播客“腦放電波”組織線下活動時,發現參與者里就有做機器人租賃生意的,服務對象多是論壇開幕式、商業活動或自媒體拍攝——核心價值是利用機器人的稀缺性和科技感吸引眼球。宇樹機器人的租賃甚至開始標準化,出現在閑魚、芝麻信用這類平臺上。


不過,隨著宇樹產能爬坡,這種稀缺性紅利正在快速消失。在表演和流量之外,極少數硬核用戶開始挖掘出宇樹機器人的真實效率。“腦放電波”在制作節目過程中調研到一位攝影師,他的案例就很有趣:他把宇樹機器狗改裝成移動燈光架,承載打光燈、補光板,通過遙控或預設路徑,在戶外街拍時替代了部分攝影助理的工作。他甚至進一步改裝,在狗背上加裝電池、網絡攝像頭和機械臂,讓機器狗具備了在家中進行安防巡檢的能力。


這些早期用戶的探索,恰恰利用了宇樹機器狗的核心優勢:相對出色的機動性能(爬坡、摔倒自恢復)、高達40公斤的負重能力、較長的續航(4小時以上),以及相對開放、對二次開發友好的特性——盡管官方文檔粗糙,但對比同行,宇樹提供的開發自由度已屬難得。


二、“土碩”王興興與宇樹的中國基因


宇樹身上的樸實甚至粗糙感,并非刻意為之。原因藏在創始人王興興的個人經歷和公司發展史中。


王興興曾在知乎平臺發文回顧他的創業原點:一個源自碩士畢業設計的機器狗項目,因為一段演示視頻在優酷、YouTube等平臺意外走紅而獲得最初的關注。他自己也坦承“運氣還不錯吧”,當年考研英語失利調劑到上海大學,反而獲得了接觸并改進四足機器人方案的機會。


他在知乎寫道:“當時發現(用電機驅動實現類似波士頓動力BigDog性能)這個點后,激動不已……認為這是四足機器人的發展趨勢,勢不可當。”


這股“勢”,離不開當時技術“基礎設施”的成熟。兩個關鍵的趨勢在此交匯:一是感知基石的普及,日本村田制作所等公司率先將角速度傳感器小型化,消費電子對角速度傳感器的巨大需求,甚至曾導致索尼PS3手柄因內置高精度慣性傳感器一度被限制出口(擔心被用于非民用用途)


二是巨大的中國供應鏈溢出效應,智能手機爆發極大推動了IMU芯片低成本化,同時Hobbyking等航模配件商將生產重心移至中國,加上大疆創新崛起和APM等開源飛控成熟,推動了無人機行業發展,也使得高性能無刷電機及其控制系統變得廉價且觸手可及。


正是這些“基礎設施”的完善,讓尚在校園的王興興能以一兩萬元人民幣的成本,“攢”出具備相當運動能力的機器狗原型。他自己也說,那份畢業作品“XDog算是我當時個人能力的最高水平了,正好發揮了我在機械、電子、編程等方面的積淀”。


抓住了時代的機遇,王興興的創業之路卻遠非一帆風順。他并非一畢業就扎入創業大潮,而是先去了當時如日中天的大疆創新,短暫工作了幾個月(從事云臺算法工作)。即便在2016年發布了號稱“首個低成本高性能”的四足機器人方案Laikago后,挑戰依然嚴峻。


在一次早期分享中,王興興言語間常常流露出“資源不夠,這個暫時不是重點”的無奈。他不避諱公司歷史上的波折。


2017年,就在發布首款產品后不久,宇樹便因融資不順陷入困境,一度發不出工資,被迫裁員。一個重要的外部變量是,2018年MIT(麻省理工學院)開源了其Cheetah Mini機器狗項目(由其Biomimetics Robotics Lab成員Benjamin Katz在其博士論文中開源)


這套方案極大地降低了四足機器人的開發門檻,并引起了機器人圈子及資本的廣泛注意,這為宇樹在2019年獲得紅杉投資奠定了一定認知基礎(不過,并無直接證據表明宇樹后續開發直接使用了該開源項目的成果。按照王興興本人的說法,MIT開源的電機和電控方案與他2016年公布的版本高度相似,且宇樹方案公布在前)


在后續的過程中,為了“活下去”,宇樹甚至嘗試過偏離主線的項目,比如一款名為“健身泵”的奇特產品——試圖將電機控制技術用在力量訓練設備上,意在快速切入消費市場獲取現金流,緩解經營壓力,但這在團隊內部引發了路線爭議且最終并未成功。


這種務實甚至有些“笨拙”的風格,與王興興的“反精英”背景不無關系。本科畢業于浙江理工大學,碩士就讀于上海大學(據他自己說是因為考研英語不及格才調劑過去的),這在遍地名校、海歸博士的硬科技創業圈中,顯得格外“接地氣”。他在民企座談會上是少有的穿著牛仔褲出席的代表,這種不拘小節、工程師本色的風格貫穿始終。


第二次轉折點來自大洋彼岸的科技巨頭。2021年起,埃隆·馬斯克開始高調介紹特斯拉的人形機器人項目Optimus,并在2022年9月展示了原型機。王興興曾在公開場合坦言,宇樹的人形機器人研發深受此啟發。


宇樹的反應極為迅速。2023年8月,他們發布了自己的人形機器人H1,并在后續迭代中部分運動指標超越了特斯拉當時展示的基準,更以9.99萬元起的價格切入市場。


宇樹能夠快速跟進并實現“低成本高性能”,核心在于兩點:一是長期積累的機電一體化能力,二是獨特的控制算法策略。


機電層面,宇樹堅持核心部件自研,掌握了電機、傳感器等關鍵環節的設計與生產制造,實現了中等性能與中等價格的良好平衡,具備很強的垂直整合能力。


一個比較具體的案例是資深硬件創客Rex對宇樹Go系列機器狗電機的拆解分析:宇樹選用了尼龍而非金屬作為齒輪材料以降低成本;整個驅動系統僅用一片電路板,省略了中高級電機常見的溫控等功能模塊,極限壓縮了成本。


但其設計亦有巧妙之處,例如利用尼龍齒輪的彈性,通過偏心軸減少齒輪間隙(backlash)。說明宇樹在降本的同時,掌握了一套與之匹配的設計方法,這套硬件設計方法也與其獨特的控制算法相輔相成。


而在讓機器人“動起來”的控制算法上,宇樹春晚舞臺和近期社交網絡上廣為流傳的“機器人跳舞”視頻,其技術底色源于模仿學習(Imitation Learning)與強化學習(Reinforcement Learning)的“疊加態”。這條技術路線并非宇樹首創,如我們可以找到迪士尼研究部門為主題樂園開發的BD-1雙足機器人(B站有一些愛好者通過開源項目復刻)


他們的做法是:先通過模仿學習讓機器人習得一套預先編排好的動作腳本(動畫),再通過強化學習算法,在機器人執行這些動作時,實時疊加動態平衡能力(這種動態平衡能力賦予了機器人真實動物的感覺,動作不僵硬),防止摔倒。宇樹的“舞蹈”正是基于此原理。相比幾年前那些只能呆板播放動作的機器人,宇樹機器人的動態平衡能力確實有了顯著提升。


但一個殘酷的事實必須被指出:無論是宇樹在春晚展示,還是社交媒體上其他博人眼球的“機器人跳舞”,現階段大多是在“閉眼”狀態下完成的。


這些機器人在跳舞時,并沒有真正利用視覺或其他傳感器來感知周圍環境。它們無法理解任務的語義,更不能像人類一樣“看一遍就會”并舉一反三,比如讓它通過觀察模仿來學會擰開一個瓶蓋,目前還做不到。所以,這些“跳舞”機器人現階段最匹配的應用場景,或許真的是去各地“印象劉三姐”式的實景演出中擔任群演。


與之對比,部分研究機構如蘇黎世聯邦理工學院(ETH)或騰訊Robotics X實驗室,他們也在使用包括宇樹的硬件平臺進行更深入的研究,這部分研究中的宇樹機器狗能夠利用激光雷達或深度相機感知環境,實現更復雜的自主行為,比如根據前方障礙物實時調整姿態,或者完成急速折返跑。


這與宇樹目前公開展示的技術存在顯著差異。一個細節是,宇樹近期發布的G1人形機器人跳舞視頻中,其雙手甚至是無法活動的塑料假手,這進一步印證了其當前能力的局限性,重點仍在全身運動而非手部的操作。


所以,宇樹的真正價值,并非體現在無所不能的“智能”上,它有點像AI領域的DeepSeek——提供了一個低門檻、高性能的硬件運動平臺,同時掌握了從核心零部件研發到整機生產制造的垂直整合能力,并以極具殺傷力的價格,將原本極其昂貴的先進機器人技術(尤其是運動控制部分)帶給了更廣泛的研究者和開發者。


這極大地降低了全球范圍內機器人科研探索和應用開發的門檻。這種獨特的平臺價值,賦予了宇樹超越自身營收規模的戰略地位。這也是王興興能夠與眾多行業巨頭一同列席高規格民企座談會的重要原因。


宇樹的存在,客觀上起到了行業催化劑的作用,也培育了開發生態,比如能夠在強化學習的主題微信群中,直接看到有機構愿意提供機器人本體并出資50萬,請人復現宇樹的運動控制算法。


三、如何“打假”具身智能?六大技術流派全解析


資深硬件黑客、機器人開發者Rex,在清華大學智能產業研究院的冬令營中,親身實踐了當前主流的六大技術流派。他的經驗為我們理解這些技術的真實能力和局限性,提供了一個清晰的參照。


1. “展會打假指南”:兩道坎看穿機器人成熟度


判斷一個機器人項目是“騾子是馬”,最直觀的方式是看它能否走出實驗室,直面真實世界的復雜性。Rex提出了兩個簡單有效的觀察點:


第一道坎:敢不敢擺攤?“不敢擺攤的一律都是拍電影。”Rex的判斷很直接。許多酷炫的概念視頻,展示機器人在家中服務、照顧老人,很可能只是對未來的暢想,并非現有能力的真實寫照。無法在人流嘈雜、光線多變、環境干擾眾多的線下展會穩定運行的項目,其技術成熟度值得懷疑。敢于公開展示真機,是邁向實際應用的第一步。


第二道坎:擺不擺警戒線?“擺攤拉不拉警戒線又是一道坎。”觀察展會現場,這是一個更細微卻關鍵的指標。那些需要用警戒線圍起來,甚至配備保安嚴密看護的機器人,即便在演示特定動作(如跳舞),也往往暴露出其在魯棒性、安全性或抗復雜環境干擾能力上的不足。


Rex提到,有些機器人在演示抓取時,目標物體不能移動,因為它是在伸手之前就計算好坐標再執行,缺乏實時適應能力。相比之下,像逐際動力等公司的雙足或四足機器人,能在展會現場的人群中自由穿梭,甚至鼓勵觀眾進行互動(如輕踹),這體現了廠家對其產品穩定性和安全性的高度自信。


目前,能達到這種“無保護”展示水平的,主要是部分機器狗和極少數雙足機器人。


從“不敢擺攤”到“擺攤拉線”,再到“撤掉警戒線自由互動”,這反映了機器人技術從實驗室走向真實場景應用的艱難爬坡。


2. L1到L5:智能分級,看清具身智能的當前身位


AI技術的快速迭代點燃了人形機器人的希望,讓人們看到了通用智能的可能性。為了更清晰地定位當前行業所處階段,我們可以借鑒小鵬汽車創始人何小鵬提出的機器人智能等級劃分(類比自動駕駛的L1~L5)


L1是純遙控,完全由人操控,無自主決策能力,宇樹的消費者版機器人就屬于此列。L2是基礎輔助智能加操控監督,能執行預編程動作(如春晚跳舞、掃地機器人),但需人持續監督。


L3是具身智能加訓練監督,能在大量場景中獨立運行,但關鍵時刻需人工接管,類似當前高階智能駕駛。行業標桿Figure AI近期展示的Helix機器人雙臂協作(分揀購物袋、手遞手交接、按屬性歸位),是目前最接近L3的演示,其背后是VLA模型的初步應用和System 1/2架構創新,但其商業化仍主要面向B端大客戶。


L4是自成長智能加輕微監督,能執行更廣泛任務,具備一定自主學習能力,接近通用智能體(Agent)的終極形態,目前尚無成熟產品。


L5則是完全自主智能(AGI),具備通用人工智能,達到甚至超越人類,是行業的終極夢想。


結論顯而易見:即使是Figure AI這樣的頂尖玩家,其公開展示也僅剛觸及L3門檻的演示階段。市場上絕大多數機器人產品,其智能水平仍停留在L1~L2。


3. 不同流派技術實踐:理想與現實的瓶頸


Rex強調一個觀點:做下盤(腿部,負責移動與平衡)和做上肢(手臂/手,負責精細操作)的技術要求差異巨大,很可能是兩類公司的能力分野。當前很多“炫技”集中在運動能力(下盤),這相對容易通過強化學習等方式快速提升;而真正體現智能、能完成復雜任務的上肢操作,挑戰重重。


以下是Rex對幾種主流技術流派的解析:


流派一:視覺+傳統控制。原理類似工業機器人,先通過視覺精確定位物體坐標,再精確計算機械臂運動軌跡執行。對于已知、靜態環境下的重復性任務(如自動化藥房抓藥),效果穩定、精度高(毫米級)。缺點是任務泛化能力極差,只能處理預先建模、認識的物體,抗干擾能力弱,不適用于家庭等非結構化、多變的環境,且編程和數據準備時間長。


流派二:端到端(End-to-End)。以斯坦福Aloha項目及其核心算法ACT為代表。試圖直接將傳感器輸入(主要是視覺)通過模型(如Transformer)映射到動作輸出(關節角度)。數據通常通過VR、外骨骼、手柄遙操作真人演示采集。理論上潛力巨大,汽車自動駕駛領域(尤其是特斯拉)已證明其可行性。但在機器人領域,現實瓶頸突出:


  • 數據采集效率極低且成本高昂,導致難以覆蓋長尾復雜場景:Rex團隊想用真人演示從盒子中取出巧克力,一小時最優秀的“數采圣手”也僅能生成上百條數據,而后續嘗試的強化學習一小時可產生千萬次嘗試數據;且個別場景希望人貢獻“完成同一個結果但是動作不重樣”的演示,實際上也非常消耗腦力。


  • 任務與視角泛化能力差:攝像頭面對的背景或視角輕微變動即失效,顯然不足以滿足生活場景需求。(相反,自動駕駛能用端到端,部分原因在于一輛汽車上的攝像頭視角相對固定)


  • 缺乏語義閉環與結果驗證:例如模仿人類擰了三下瓶蓋,但不代表擰緊了。


流派三:強化學習(Reinforcement Learning,RL)。以開源庫SB3、RSL-RL等為代表。在仿真環境(如Nvidia Isaac Sim)中,設定明確的獎懲規則,讓機器通過海量并行試錯自主學習最優策略。


其優勢在于極適合下肢運動控制(行走、平衡、適應地形),訓練速度驚人(筆記本電腦上訓練上60秒就能走起來),無需精確演示,能探索超乎想象的方案,對特定場景(如下肢控制)潛力巨大。


然而,這一技術的瓶頸也很明顯:獎勵函數設計極難,尤其對復雜、柔性任務(如拉拉鏈、判斷碗是否洗凈),把這類任務的完成度編程為獎勵函數,需要極高的工程能力,難以規模化。


流派四:監督模仿學習(Supervised Imitation Learning)。結合了模仿學習和強化學習的優點。先由人類提供少量成功演示,然后設定明確的任務成功標準(監督信號),讓機器在仿真中基于演示大量隨機探索、增殖數據,并用監督標準篩選有效數據。


這種方法數據效率高(10次演示可增殖上萬有效數據),簡化了獎勵函數設計(比如讓機器人學會“拉拉鏈”,在強化學習中需要設計獎勵函數,但在監督模仿學習中只需要讓機器人學會判定“拉鏈的左右兩端碰在一起”即可)


Rex個人看好此方向,Figure等公司可能在采用類似思路(正在大規模招聘遙控操作員且三班倒,推測存在大量的演示數據需求)。但它仍依賴仿真環境,如何有效增殖和篩選數據是關鍵。


流派五:在線強化學習/持續學習(Online RL/Continual Learning)。以Berkeley的SERL、HIL-SERL研究為代表。將強化學習過程直接放到真實機器人上,讓機器人在與物理世界交互中“邊做邊學”,實時微調策略(初始獎勵模型來自少量人類演示)


理論上,這能彌合仿真與現實鴻溝,解決“手感”等難以建模的問題,更接近人類學習方式(Rex用學騎車、游泳類比,強調親身實踐微調的重要性)。但現實是技術非常早期,效率低、復現困難,且在現實中大量試錯存在安全和成本風險。Rex認為它更適合在模型基本掌握技能后,進行最后的精細調整(任務的最后1%),而非從零開始。


流派六:視覺-語言-行動模型(Vision-Language-Action,VLA)。以Helix模型(來自Figure AI)、Pi-0及Pi-0.5(來自physica lintelligence)等為代表。這是當前最受矚目、被認為最有希望通向通用具身智能的路徑。


它基于大模型思想,試圖將視覺感知(V)、語言理解(L)、動作執行(A)統一到一個模型框架中。語言模型不僅用于接收指令,其蘊含的世界知識和推理能力是關鍵,能幫助機器人理解抽象概念、泛化,甚至涌現新能力。其優勢巨大:


  • 自然語言交互降低門檻(未來可能“語言即SaaS”)


  • 具備基于“概念空間”的涌現和泛化能力(如figure機器人被要求去拿“沙漠里的東西”,會推理拿起仙人掌)


然而,現實瓶頸同樣尖銳:


  • 數據是核心難題,需要海量、高質量、多模態(視覺序列、關節序列、語言、力反饋等)對齊數據,復雜度遠超純語言或視覺模型;


  • 人工采集成本高昂(如智元等公司,選擇在上海建3000平大小,容納幾百人的數采中心)


  • 現有VR/遙操作數據維度缺失(缺力、空間、多感官信息,更像“舞蹈數據”,無法復刻人類綜合運用聲、溫、震動、重量等感官判斷的過程)


  • 硬件標準不統一導致數據難通用,數據壁壘高筑;


  • 模型規模受限,當前VLA模型參數量小(Rex類比0.01B語言模型),遠未達到涌現所需規模(可能需10B-100B級別),易過擬合。


在這個方面,雖然Pi-0的開源模型如同LLaMA,為社區研究提供了基礎,但仍屬早期。


4. 癥結所在:數據,難以逾越的高墻?


梳理完各大技術流派,一個共同的挑戰浮出水面:數據。


Rex的結論非常明確:當前阻礙具身智能發展的最大瓶頸,并非制造能力(中國在電機、傳感器、供應鏈方面有巨大優勢,制造一個物理上合格的機器人本體對大廠而言并非難事,手機、汽車公司都可以輕松實現),也非基礎算法(大部分算法已開源或快速迭代,領先優勢難以長期保持),而是高質量、大規模、標準化的訓練數據。


理想的數據構成可能是:10%高質量人類演示數據+80%仿真生成的合成數據+10%在線/持續學習獲得的真實世界反饋數據。所有這些數據,最終都需要服務于強大的VLA模型。



本文來自微信公眾號:腦放電波 (ID:BrainAMP),作者:腦放電波

本內容為作者獨立觀點,不代表虎嗅立場。未經允許不得轉載,授權事宜請聯系hezuo@huxiu.com
如對本稿件有異議或投訴,請聯系tougao@huxiu.com
正在改變與想要改變世界的人,都在 虎嗅APP
主站蜘蛛池模板: 江山市| 清徐县| 沙坪坝区| 广安市| 四子王旗| 屯留县| 延川县| 镇平县| 揭东县| 合肥市| 微山县| 乌鲁木齐市| 盐津县| 鄯善县| 沭阳县| 青冈县| 绥阳县| 朝阳区| 图木舒克市| 荥阳市| 邹平县| 广元市| 南郑县| 海兴县| 定陶县| 汝州市| 西城区| 东丽区| 丹巴县| 安岳县| 龙山县| 兴化市| 滁州市| 咸宁市| 确山县| 陆良县| 崇礼县| 西乌珠穆沁旗| 社旗县| 江山市| 博野县|