- 探索冬日奇旅,《第五人格》2024連云港節(jié)氣場(chǎng)介紹
- 智殼搭配指南,《伊瑟》彌亞瑟智殼選擇及詞條推薦
- 新手必備指南,《弓箭傳說2》新手玩法介紹
- 新春福利來襲,《地下城與勇士:起源》斷橋煙雨促銷活動(dòng)介紹
- 遠(yuǎn)程伙伴推薦指南,《差不多高手》醉拳龍技能特點(diǎn)分享
- 新春歡慶,《地下城與勇士:起源》阿拉德迎新春活動(dòng)概覽
- 探索游戲潛能,《差不多高手》情圣技能特點(diǎn)分享
- 全新時(shí)裝奇遇,《第五人格》第三十六精華3時(shí)裝介紹
- 隊(duì)友搭配指南,《伊瑟》彌亞瑟隊(duì)友選擇攻略
- 探索角色奧秘,《伊瑟》彌亞瑟技能解析
聲明:本文來自于(ID:ykqsd.com)授權(quán)轉(zhuǎn)載發(fā)布。
出品:網(wǎng)易科技《態(tài)度AGI》欄目
作者:崔玉賢
編輯:丁廣勝
“下周,智元機(jī)器人將發(fā)布全新產(chǎn)品。”華為離職天才少年、智元聯(lián)合創(chuàng)始人“稚暉君”(彭志輝)在社交媒體上發(fā)出預(yù)告。
3月10日上午,“好東西”如期而至,智元機(jī)器人官方宣布正式發(fā)布首個(gè)通用具身基座模型——智元啟元大模型GO-1(Genie Operator-1),這也是國內(nèi)首個(gè)通用具身基座大模型。
此消息迅速登上熱搜,引發(fā)廣泛關(guān)注。
根據(jù)官方介紹,智元的GO-1大模型采用了創(chuàng)新的Vision-Language-Latent-Action (ViLLA)架構(gòu),該架構(gòu)由VLM(多模態(tài)大模型)與MoE(混合專家)組成,具備人類視頻學(xué)習(xí)能力、小樣本快速泛化、一腦多形、持續(xù)進(jìn)化等顯著優(yōu)勢(shì)。這一架構(gòu)使機(jī)器不僅具備了運(yùn)動(dòng)能力,更實(shí)現(xiàn)了AI功能,真正賦予了機(jī)器價(jià)值。
在對(duì)GO-1進(jìn)行多維度測(cè)試后發(fā)現(xiàn),其在五個(gè)不同復(fù)雜度任務(wù)中的成功率較現(xiàn)有最優(yōu)模型大幅提升,平均成功率提高32%(從46%提升至78%)。
其中,“倒水”、“清理桌面”和“補(bǔ)充飲料”等任務(wù)表現(xiàn)尤為突出。
在ViLLA架構(gòu)中,Latent Planner作為MoE的一組專家,基于VLM的中間層輸出預(yù)測(cè)Latent Action Tokens作為CoP(Chain of Planning,規(guī)劃鏈),實(shí)現(xiàn)了通用的動(dòng)作理解和規(guī)劃。單獨(dú)驗(yàn)證Latent Planner在ViLLA架構(gòu)中的作用后,其成功率提升了12%(從66%提升至78%)。
推出GO-1后,智元機(jī)器人將具身智能技術(shù)的應(yīng)用場(chǎng)景從單一任務(wù)擴(kuò)展到了多任務(wù)并行,從封閉環(huán)境轉(zhuǎn)向開放世界,從預(yù)設(shè)程序走向指令泛化,標(biāo)志著具身智能技術(shù)進(jìn)入了一個(gè)全新的發(fā)展階段。
智元機(jī)器人將于2025年第二季度推出首個(gè)基于強(qiáng)化學(xué)習(xí)的Foundation Model。
在GO-1大模型正式發(fā)布之后,智元合伙人、具身業(yè)務(wù)部總裁、研究院執(zhí)行院長(zhǎng)姚卯青以及智元具身研究中心常務(wù)主任任廣輝接受了網(wǎng)易科技的采訪。
對(duì)于發(fā)布基座大模型的目的,姚卯青表示,AI技術(shù)將成為機(jī)器人產(chǎn)品核心競(jìng)爭(zhēng)力的關(guān)鍵要素,而機(jī)器人行業(yè)的發(fā)展最終將取決于其AI能力。因此,任何機(jī)器人公司若不投入大模型技術(shù)的研發(fā),則難以在未來的競(jìng)爭(zhēng)中立于不敗之地。
對(duì)于智元來說,AI技術(shù)的投入被視為一項(xiàng)具有戰(zhàn)略意義的長(zhǎng)期規(guī)劃,且是堅(jiān)定的。
此外,智元在發(fā)布基座大模型的同時(shí),還同步發(fā)布了相關(guān)論文,這在一定程度上可被視為一種開放式的做法。據(jù)姚卯青透露,智元將在2025年第一季度向核心用戶開源整個(gè)大模型。
在采訪中,姚卯青還深入探討了行業(yè)熱議的"9.9萬人形機(jī)器人"話題。他認(rèn)為,機(jī)器人硬件的基礎(chǔ)性能同樣決定了其能力的上限。在這一階段,智元仍然堅(jiān)持認(rèn)為,以價(jià)值為導(dǎo)向,讓機(jī)器人硬件與軟件協(xié)同合作,產(chǎn)生良好的效果,才是正確的研發(fā)方向,而不是簡(jiǎn)單地追求體積大的"玩具"。
姚卯青表示,人形機(jī)器人的應(yīng)用將是一個(gè)漸進(jìn)的過程。目前,人形機(jī)器人已在局部場(chǎng)景中實(shí)現(xiàn)應(yīng)用落地,但大家期待的機(jī)器人進(jìn)入家庭場(chǎng)景,還需要再等5年左右。
智元機(jī)器人公司成立于2023年,創(chuàng)始人彭志輝早年曾在華為擔(dān)任要職,后轉(zhuǎn)投智元。自成立以來,公司就已推出首款真正意義上的人形機(jī)器人,并已批量下線1000臺(tái)機(jī)器人產(chǎn)品,完成了多輪融資,累計(jì)融資金額超過16億元。
值得一提的是,智元的創(chuàng)始人彭志輝還是B站知名UP主。2017年,他開始在B站發(fā)布視頻內(nèi)容。2020年,憑借在B站制作的硬核小電視視頻走紅。2024年,他在公開演講中盛贊其從"野生鋼鐵俠"成長(zhǎng)為70億估值企業(yè)CTO的成長(zhǎng)軌跡。
以下是對(duì)原文的改寫版本:
1. 以下為對(duì)話智元合伙人、具身業(yè)務(wù)部總裁、研究院執(zhí)行院長(zhǎng)姚卯青以及智元具身研究中心常務(wù)主任任廣輝的部分內(nèi)容:
2. 提問:智元具身基座大模型的研發(fā)初衷是什么?
3. 姚卯青:這與我們公司的使命緊密相連。我們公司的使命是通過通用機(jī)器人創(chuàng)造無限生產(chǎn)力。我們認(rèn)為,機(jī)器人僅憑硬件本體(HBP)是不夠的,這也是當(dāng)前一些機(jī)構(gòu)或國外公司對(duì)機(jī)器人行業(yè)的評(píng)論,認(rèn)為中國人形機(jī)器人公司在硬件領(lǐng)域表現(xiàn)突出,但在AI能力方面尚未見到顯著進(jìn)展。
4. 我們認(rèn)為,AI能力將是未來機(jī)器人產(chǎn)品競(jìng)爭(zhēng)力的核心驅(qū)動(dòng)力,就像今天的新能源車和智能手機(jī)一樣,硬件領(lǐng)域趨于收斂,供應(yīng)鏈高度整合,最終的對(duì)決將集中在AI能力上。
5. 對(duì)于機(jī)器人而言,沒有自主作業(yè)能力的價(jià)值是有限的?;谶@一初衷,我們將具身智能的AI研發(fā)提升為公司戰(zhàn)略級(jí)的投入。我們也是首個(gè)實(shí)現(xiàn)大規(guī)模機(jī)器人量產(chǎn),并用這批產(chǎn)線采集的數(shù)百萬高質(zhì)量數(shù)據(jù)進(jìn)行自研大模型訓(xùn)練,同時(shí)將大模型部署回硬件本體。這一閉環(huán)的研發(fā)迭代是 industry-defining的。
6. 提問:大模型的應(yīng)用場(chǎng)景將經(jīng)歷怎樣的演變?
7. 姚卯青:我們預(yù)計(jì),大模型在機(jī)器人行業(yè)的應(yīng)用將經(jīng)歷漸進(jìn)式演變,從結(jié)構(gòu)化場(chǎng)景較為明確的領(lǐng)域開始逐步落地探索,隨后向半結(jié)構(gòu)化和半開放的任務(wù)和場(chǎng)景擴(kuò)展。通過在各行業(yè)、各場(chǎng)景中持續(xù)積累海量數(shù)據(jù)和交互數(shù)據(jù),我們最終將實(shí)現(xiàn)通用人工智能(AGI)在物理世界的應(yīng)用,真正走進(jìn)千家萬戶,尤其在家庭中執(zhí)行各類開放式的指令任務(wù)。
8. 從這一角度看,我們?cè)谶^去兩年內(nèi)將重點(diǎn)布局工業(yè)、服務(wù)業(yè)和商業(yè)領(lǐng)域的應(yīng)用,同時(shí)堅(jiān)定地為最終實(shí)現(xiàn)AGI、走進(jìn)家庭這樣的開放式場(chǎng)景持續(xù)技術(shù)積累。
9. 提問:智元的具身基座大模型GO1可以降低成本,具體能夠降低多少幅度?
讓我們回顧一下之前的研究成果。在特定場(chǎng)景中,完成一個(gè)任務(wù)所需的訓(xùn)練數(shù)據(jù)量可能達(dá)到數(shù)千條甚至數(shù)百條就能達(dá)到最佳效果,相比之前需要的萬條規(guī)模,這相當(dāng)于降低了數(shù)量級(jí)的數(shù)據(jù)采集要求。
智元開發(fā)的具身基座大模型開源后,其應(yīng)用前景如何?
我們可以看到,智元推出的核心技術(shù)已正式發(fā)布,并同步公開了技術(shù)博客和相關(guān)論文。某種程度上,這也算是對(duì)智元平臺(tái)的開源。我們計(jì)劃在本季度對(duì)核心用戶進(jìn)行模型開源,允許他們將模型部署到智元的機(jī)器人上進(jìn)行應(yīng)用。
機(jī)器人技術(shù)方面,我們認(rèn)為目前仍處于早期階段,尚未達(dá)到技術(shù)收斂狀態(tài)。由于行業(yè)受限于數(shù)據(jù)供應(yīng)的問題,尚未完成從局部驗(yàn)證到全面驗(yàn)證的完整過程。這也是我們此前選擇主動(dòng)開源AgiBot World的原因。
在機(jī)器人智能等級(jí)標(biāo)準(zhǔn)(G1-G5)的體系中,智元的GO1技術(shù)應(yīng)該處于哪個(gè)等級(jí)?
目前發(fā)布的相關(guān)技術(shù)處于G3至G4之間的過渡階段。
數(shù)據(jù)集采集的未來走向是否會(huì)單獨(dú)剝離出來形成一個(gè)獨(dú)立的產(chǎn)業(yè)?
這一趨勢(shì)是有可能的。從AI產(chǎn)業(yè)發(fā)展的明確分工來看,數(shù)據(jù)采集、標(biāo)注、審核甚至數(shù)據(jù)交易等環(huán)節(jié)都已經(jīng)出現(xiàn)了以平臺(tái)為主導(dǎo)的機(jī)構(gòu)。在機(jī)器人領(lǐng)域,這一情況同樣具備可復(fù)制性。
未來,機(jī)器人技術(shù)的發(fā)展將主要聚焦于哪些方面?技術(shù)路徑和市場(chǎng)趨勢(shì)是怎樣的?
在技術(shù)路徑和市場(chǎng)趨勢(shì)方面,機(jī)器人的核心競(jìng)爭(zhēng)力將源自于AI技術(shù)的持續(xù)進(jìn)步。我們預(yù)計(jì),隨著AI技術(shù)的不斷演進(jìn),機(jī)器人領(lǐng)域的競(jìng)爭(zhēng)將更加激烈,市場(chǎng)也將呈現(xiàn)出多元化的發(fā)展格局。
姚卯青:我認(rèn)為算法目前還處于發(fā)展的初期階段,還不能說已經(jīng)形成了完整的生態(tài)鏈。但在這一過程中,我們確實(shí)遇到了一些挑戰(zhàn)。例如,偏科現(xiàn)象較為普遍,一些公司在算法方面有顯著優(yōu)勢(shì),包括一些國外公司,雖然在AI算法方面表現(xiàn)突出,但在機(jī)器人硬件和機(jī)器人本體的生產(chǎn)規(guī)模上卻相對(duì)薄弱,這在一定程度上限制了其在算法研發(fā)和驗(yàn)證方面的整體能力。另一方面,一些專注于硬件制造的公司由于行業(yè)限制,其在AI領(lǐng)域的投入也受到較大制約。
我們希望看到更多的公司能夠像智元這樣,從硬件、數(shù)據(jù)、算法等端到端,具備完整的研發(fā)能力,從而在這一領(lǐng)域形成更多具有競(jìng)爭(zhēng)力的創(chuàng)新者。
提問:您認(rèn)為智能機(jī)器人何時(shí)能夠走進(jìn)家庭場(chǎng)景應(yīng)用?
姚卯青:我們預(yù)測(cè),這一目標(biāo)的實(shí)現(xiàn)可能需要大約五年的努力,才能真正推動(dòng)智能機(jī)器人走入家庭,創(chuàng)造實(shí)際價(jià)值。
提問:之前有人對(duì)9.9萬元價(jià)位下的機(jī)器人表示擔(dān)憂,您認(rèn)為這一價(jià)位是否具有真正的市場(chǎng)價(jià)值?
姚卯青:9.9萬元價(jià)位確實(shí)引起了廣泛關(guān)注。但是,行業(yè)內(nèi)的從業(yè)者都知道,目前生產(chǎn)高質(zhì)量零部件的成本較高。如果價(jià)格虛高,顯然是在使用劣質(zhì)材料。此外,硬件的基礎(chǔ)配置也決定了機(jī)器人的能力上限。在此階段,我們始終堅(jiān)持價(jià)值導(dǎo)向,只有當(dāng)機(jī)器人的硬件與軟件協(xié)同作用,才能產(chǎn)生真正的好效果,為用戶提供實(shí)際價(jià)值。單純購買一個(gè)大號(hào)的電動(dòng)玩具,長(zhǎng)期來看不具備良好的商業(yè)價(jià)值。
提問:智元今年的商業(yè)計(jì)劃是什么?
姚卯青:今年我們的增長(zhǎng)目標(biāo)是營收的倍增,出貨量將突破數(shù)千臺(tái)。
提問:智元成立僅兩三 years,如何與成立八九年甚至更長(zhǎng)時(shí)間的公司競(jìng)爭(zhēng)?競(jìng)爭(zhēng)優(yōu)勢(shì)是什么?
姚卯青:我覺得成立時(shí)間較短的公司具有較大的競(jìng)爭(zhēng)優(yōu)勢(shì)。因?yàn)橹悄軝C(jī)器人產(chǎn)業(yè)從技術(shù)上說是一個(gè)新興行業(yè),而能夠成功的大模型公司往往在組織結(jié)構(gòu)上有著非常年輕化的方向。
在制定經(jīng)營戰(zhàn)略或技術(shù)規(guī)劃時(shí),我們需要克服"unlearnable"的障礙,如果存在過多的歷史包袱,就難以采取-bold的策略性調(diào)整。發(fā)展到一定規(guī)模的公司,從資本運(yùn)作層面和經(jīng)營層面都會(huì)變得更加保守、務(wù)實(shí)。
智元公司成立兩年來,平均研發(fā)年齡為30歲以下,無論是產(chǎn)品銷量還是收入,都實(shí)現(xiàn)了快速提升。
相信今年我們有機(jī)會(huì)在經(jīng)營層面上實(shí)現(xiàn)國內(nèi)行業(yè)領(lǐng)軍,成為真正的行業(yè)龍頭。我們用兩年時(shí)間走完了別人可能需要八年、九年才能完成的路程,這得益于快速上升的趨勢(shì)。
海螺里的秘密,聽海的聲音, sea by your ear 鈔票清理師模擬器 立即購買,鈔票清理工模擬器下載地址在哪里?Cash Cleaner Simulator游戲下載鏈接介紹 航空巨匠,國航實(shí)現(xiàn)拉薩航線安全飛行60周年 神秘的跳轉(zhuǎn),刺客信條信仰之躍彩蛋位置在哪 保健品與藥品的本質(zhì)區(qū)別,健康知識(shí)講座:失眠困擾,如何選擇助眠保健品? AI初創(chuàng)企業(yè)的避雷手冊(cè)Manus的黑科技,Manus的爆雷時(shí)刻:從爆火到失敗的原因分析 超全攻略,《天天闖關(guān)》一鍵刮卡攻略 打破隔閡,哪吒2全面打開歐洲市場(chǎng),美國天元鼎即將裂開 狂暴之主怒吼之刃,《街機(jī)恐龍》大力士邁斯技能介紹 孕期失眠困擾,孕期失眠困擾?專家解析原因及解決之道!