2 月 27 日,Messari 舉辦了一場關於「建立去中心化實體人工智慧」的播客,邀請了 FrodoBot Lab 的共同創辦人 Michael Cho。他們聊了聊去中心化實體基礎設施網路(DePIN)在機器人技術領域的挑戰和機會。這個領域雖然還在起步階段,但潛力巨大,可能會徹底改變AI 機器人在現實世界中的運作方式。然而,和那些依賴大量網路數據的傳統AI 不同,DePIN 機器人 AI 技術面臨的問題更複雜,例如數據收集、硬體限制、評估瓶頸,還有經濟模式的可持續性。
在今天的文章裡我們會拆解這次討論中的關鍵點,看看 DePIN 機器人技術遇到了哪些問題,擴展去中心化機器人的主要障礙是什麼,以及為什麼DePIN 比中心化的方法更有優勢。最後,我們也會探討DePIN 機器人技術的未來,看看我們是否快要迎來 DePIN 機器人技術的「ChatGPT 時刻」。
DePIN 智慧機器人的瓶頸在哪裡?
Michael Cho 剛開始做FrodoBot 的時候,最頭痛的就是機器人技術的成本問題。市面上商用機器人價格高得離譜,導致了 AI 在現實世界的應用產品難以推廣。他最初的解決方案是:打造一個低價格自主機器人,成本只要500 美元,打算以比大多數現有專案便宜的價格優勢取勝。
但隨著他和團隊深入研發,Michael 意識到,成本並不是真正的瓶頸。去中心化實體基礎設施網路(DePIN)在機器人技術中的挑戰,遠比「貴不貴」複雜得多。隨著FrodoBotLab 的不斷推進,DePIN 機器人技術的多個瓶頸也逐漸浮現。要實現大規模部署,以下這些瓶頸必須被克服。
瓶頸一:數據
和那些靠著大量網路資料訓練出來的線上AI 大模型不同,具身化 AI(embodied AI) 需要與現實世界互動才能發展出智慧。問題是,目前世界上並不具備這種大規模的基礎,而且大家對於怎麼收集這些數據也沒有共識。具身化 AI 的資料收集可歸類為以下三大類:
▎第一類是人類操作數據,就是人類手動控制機器人時產生的數據。這類數據品質很高,能捕捉到視訊串流和動作標籤——也就是人類看到什麼,怎麼做出相對應的反應。這是訓練 AI 模仿人類行為最有效的方式,但缺點是成本高,勞動強度也大。
▎第二類是合成資料(模擬資料),這類資料對訓練機器人在複雜地形中移動很有用,例如訓練機器人在崎嶇的地面上行走,對於一些專用領域很有用途。但對於一些變化多端的任務,例如做飯,模擬環境就不太行了。我們可以想像訓練機器人煎蛋的情況:鍋子的種類、油溫、房間條件的微小變化都會影響結果,而虛擬環境很難涵蓋所有場景。
▎第三類是視訊學習,就是讓AI 模型透過觀察現實世界的影片來學習。雖然這種方法有潛力,但它缺乏智慧所需的真正物理的直接互動回饋。
瓶頸二:自主性水平
Michael 提到他第一次在現實世界中測試FrodoBot 時,主要是用機器人做最後一哩的配送。從數據上看,結果其實還不錯——機器人成功完成了90% 的配送任務。但現實生活裡 10% 的失敗率是不可接受的。一個每十次配送就失敗一次的機器人,根本無法商業化。就像自動化駕駛技術一樣,無人駕駛可以有一萬次的成功駕駛記錄,但是一次失敗就足以打敗商業消費者的信心。
因此,要讓機器人技術真正實用,成功率得接近99.99% 甚至更高。但問題是,每提高 0.001% 的準確率,都需要付出指數級的時間和精力。很多人低估了這最後一步的難度。
Michael 回憶說, 2015 年他坐在Google的自動駕駛汽車原型裡時,覺得完全自主駕駛馬上就要實現了。十年過去了,我們仍然在討論什麼時候能實現Level 5 的完全自主性。機器人技術的進步不是線性的,而是指數性質的──每前進一步,難度都會大幅增加。這最後的1% 準確率,可能需要幾年甚至幾十年才能實現。
瓶頸三:硬體:光靠AI 解決不了機器人問題
退一步講,即使AI 模型再厲害,現有的機器人硬體也還沒準備好實現真正的自主性。例如在硬體上最容易被忽略的問題是缺乏觸覺感測器——目前最好的技術,例如Meta AI 的研究,還遠遠達不到人類指尖的敏感度。人類靠視覺和觸覺與世界互動,而機器人對紋理、抓握和壓力回饋幾乎一無所知。
還有遮擋問題——當物體部分被擋住時,機器人很難辨識和互動。而人類即使看不到物體的全貌,也能憑直覺理解它。
除了感知問題,機器人執行器本身也有缺陷。大多數仿人機器人把執行器直接放在關節上,導致它們笨重且潛在危險。相較之下,人類的肌腱結構讓動作更平滑、更安全。這就是為什麼現有的仿人機器人看起來僵硬且不靈活。像Apptronik 這樣的公司正在開發更俱生物靈感的執行器設計,但這些創新還需要時間才能成熟。
瓶頸四:硬體擴充為什麼這麼難
和那些只依賴運算能力的傳統AI 模型不同,智慧機器人技術的實作需要在現實世界中部署實體設備。這帶來了巨大的資本挑戰。造機器人很貴,也只有那些最有錢的大公司才能負擔得起大規模實驗。即使是最高效的仿人機器人,現在的成本也高達數萬美元,大規模普及根本不切實際。
瓶頸五:評估有效性
這是一個「隱形」瓶頸。大家想一下,像 ChatGPT 這樣的線上 AI 大模型幾乎可以瞬間測試其功能——一個新語言模型被發布後,全世界的研究人員或者普通用戶基本上在幾小時之內就能對它的性能好壞得出結論。但評估實體AI 需要現實世界的部署,這需要時間。
特斯拉的全自動駕駛(FSD)軟體就是個好例子。如果特斯拉記錄了100 萬英里且沒有事故,這是否意味著它真的達到了Level 5 自主性? 1000 萬英里呢?機器人智慧技術的問題是,唯一驗證它的方法是看它最終在哪裡失敗,也意味著大規模,長時間的即時部署。
瓶頸六:人力
另一個被低估的挑戰是,在機器人 AI 開發中人類勞動力依然不可或缺。光靠AI 是不夠的。機器人需要人類操作員提供訓練資料;維修團隊保持機器人的運作;以及不可或缺的研究人員/開發人員持續去優化AI 模型。和那些可以在雲端訓練的AI 模型不同,機器人需要持續的人類介入——這也是DePIN 必須解決的主要挑戰。
未來:機器人技術的ChatGPT 時刻何時到來?
有些人認為,機器人技術的ChatGPT 時刻即將到來。 Michael 對此持一定的懷疑態度。考慮到硬體、數據和評估的挑戰,他認為通用機器人AI 距離大規模採用還很遙遠。不過,DePIN 機器人技術的進展確實讓人看到了希望。機器人技術的開發應該是去中心化的,而不是由少數大公司控制。一個去中心化網路的規模和協調性能夠分散資本負擔。與其依賴大公司出錢造幾千台機器人,不妨將可以貢獻的個人放入共享網路。
舉例而言--首先,DePIN 加速了資料收集和評估。不用等一家公司部署有限的機器人收集數據,去中心化網路可以以更大的規模並行運作、收集數據。例如,在最近一次阿布達比的一場AI 與人類機器人競賽中,來自DeepMind 和UT Austin 等機構的研究人員將他們的AI 模型與人類玩家進行了測試。雖然人們依然佔上風,但研究人員對從現實世界機器人互動中收集的獨特數據集感到十分振奮。這從側面證明了連接機器人技術各個組成部分的子網路的需求。研究界的熱情也表明,即使完全自主性仍然是一個長期目標,DePIN 機器人技術已經從資料收集和訓練到現實世界部署和驗證方面展示了切實的價值。
另一方面,AI 驅動的硬體設計改進,例如用AI 優化晶片和材料工程,可能會大大縮短時間軸。一個具體的例子是FrodoBot Lab 與其他機構合作,確保了兩盒NVIDIA H100 GPU——每個盒子都包含八個H100 晶片。這為研究人員提供了必要的運算能力,用來處理和優化從機器人部署中收集的現實世界數據的AI 模型。如果沒有這樣的運算資源,即使是最有價值的資料集也無法充分利用。可見透過DePIN 去中心化運算基礎設施的訪問,機器人技術網路可以讓全球的研究人員在不被資本密集的GPU 所有權所限制的情況下訓練和評估模型。如果DePIN 能成功眾包數據和硬體進步,機器人技術的未來可能會比預期更早到來。
此外,像Sam 這樣的AI 代理(一個帶有meme 幣的旅行KOL 機器人)展示了去中心化機器人技術網絡的新盈利模式。 Sam 自主運行, 24/7 在多個城市直播,而它的meme 幣也在增值。這種模式展示了由 DEPIN 驅動的智慧機器人如何透過去中心化所有權和代幣激勵來維持自身財務。未來,這些AI 代理甚至可以用代幣支付人類操作員的協助、租用額外的機器人資產,或競標現實世界的任務,從而形成一個既有利於AI 開發又有利於DePIN 參與者的經濟循環。
總結
機器人AI 的發展不僅取決於演算法,還涉及硬體升級、數據累積、資金支持以及人的參與。過去,機器人產業的發展受限於高昂的成本和大型企業的主導地位,使得創新速度受阻。而 DePIN 機器人網路的建立意味著,借助去中心化網路的力量,機器人資料收集、運算資源和資本投入可以在全球範圍內協同進行,不僅加速AI 訓練和硬體優化,還能降低開發門檻,讓更多研究人員、創業家和個人用戶參與其中。我們也期待,機器人產業不再依賴少數科技巨頭,而是由全球社群共同推動,邁向真正開放、永續的科技生態。
*Coinspire 平台上的所有內容僅供參考,不構成任何投資策略的要約或建議,基於本文內容所做的任何個人決策均由投資者自行承擔責任,Coinspire 不對由此產生的任何收益或損失負責。
投資有風險,決策需謹慎