摘要:從“圈地自萌”到商業(yè)落地,人形機(jī)器人領(lǐng)域需要真正的“未來可期”。
2022年10月1日,特斯拉Optimus人形機(jī)器人,搭載特斯拉同款自動(dòng)駕駛軟件系統(tǒng)和傳感器,首次亮相特斯拉AI Day。在當(dāng)時(shí)驚艷一時(shí)的Optimus,隨著今年9月最新展示視頻的公開,這款直譯為“擎天柱”的特斯拉人形機(jī)器人顯然已經(jīng)再度進(jìn)化。
那么2023年最新的人形機(jī)器人,究竟走到哪一步了?
從視頻展現(xiàn)的信息來看,如今的特斯拉Optimus已經(jīng)完全可以依靠視覺系統(tǒng)分揀物品。最重要的是,該機(jī)器人的操作無需任何規(guī)則代碼,而是通過視覺傳感器,直接實(shí)現(xiàn)機(jī)器人操作。
人形機(jī)器人的識(shí)別操作往往需要特征提取以及其他中間步驟地干預(yù),而特斯拉Optimus識(shí)取則是跳過這一步,通過端到端的方法來實(shí)現(xiàn)神經(jīng)網(wǎng)絡(luò)訓(xùn)練以及對(duì)數(shù)據(jù)特征地學(xué)習(xí)。
端對(duì)端實(shí)現(xiàn)的是對(duì)人形機(jī)器人的本地化自主學(xué)習(xí)能力的提升,這無疑極大提升了Optimus的精校準(zhǔn)能力,也就是關(guān)于自身形態(tài)微調(diào)方面的能力。通過本地化的神經(jīng)網(wǎng)絡(luò)的校錯(cuò),人形機(jī)器人可以實(shí)現(xiàn)動(dòng)作方面極為精細(xì)的自主校準(zhǔn)。
這其中就包括手部和關(guān)節(jié)位置的微調(diào)。彼時(shí)需要大量的數(shù)據(jù)支持才能操作的內(nèi)容,現(xiàn)如今只需依靠機(jī)器人自身的視覺系統(tǒng)就可以輕松實(shí)現(xiàn)。視頻中,Optimus做瑜伽的畫面給人的印象非常深刻。舒展而準(zhǔn)確的動(dòng)作組合,是人形機(jī)器人在物理形態(tài)中尋求突破的最好展現(xiàn)。
業(yè)內(nèi)普遍認(rèn)為,真正擁有智能“大腦”和仿生物理形態(tài)的人形機(jī)器人,就是該領(lǐng)域商業(yè)化應(yīng)用的最終形態(tài)。
從23年5月英偉達(dá)創(chuàng)始人兼首席執(zhí)行官黃仁勛在ITF World 2023半導(dǎo)體大會(huì)上提及的“具身智能”概念,和本次特斯拉Optimus所展現(xiàn)的部分性能表現(xiàn)不謀而合,即理解、推理并與物理世界互動(dòng)的智能系統(tǒng)。
無論作為科技領(lǐng)域的新技術(shù)展現(xiàn),還是AI智能工業(yè)化運(yùn)用,人形機(jī)器人的技術(shù)創(chuàng)新都會(huì)成為機(jī)器人產(chǎn)品端的新亮點(diǎn)。
根據(jù)特斯拉透露的未來方向,Optimus的應(yīng)用場景未來可能會(huì)涉及工業(yè)生產(chǎn),也就是由人形機(jī)器人全程接管汽車生產(chǎn)領(lǐng)域,實(shí)現(xiàn)真正的無人生產(chǎn)。人機(jī)協(xié)同的未來可期,和現(xiàn)如今高速擴(kuò)張的人形機(jī)器人市場,都給全球機(jī)器人領(lǐng)域創(chuàng)新發(fā)展帶來了巨大潛能。
從GGII于2023年5月發(fā)布的報(bào)告預(yù)測(cè),人形機(jī)器人市場有望在2026年的服務(wù)型機(jī)器人中的滲透率來到3.5%,市場規(guī)模超20億美元。并且在高速發(fā)展下,這個(gè)數(shù)字在2030年前后會(huì)來到200億美元。
技術(shù)的革新,尤其是底層技術(shù)進(jìn)化所帶來的的結(jié)果,無疑是給大規(guī)模商業(yè)化的實(shí)現(xiàn)帶來強(qiáng)大動(dòng)力。
人工智能企業(yè)微美全息將人形機(jī)器人列為重點(diǎn)發(fā)展項(xiàng)目,谷歌微軟等AI軟件領(lǐng)域巨頭,也在探索AI算法與GPT在機(jī)器人領(lǐng)域?qū)崿F(xiàn)軟硬件結(jié)合的可能性。
目前GPT-4所賦予的,以自然語言作為人機(jī)交互的核心的能力,以及多模態(tài)處理能力。AI能力的提升,可以讓人形機(jī)器人的交互更為智能簡便。
感知、決策和執(zhí)行,可作為機(jī)器人的技術(shù)閉環(huán)來發(fā)展和實(shí)現(xiàn)。而一旦實(shí)現(xiàn)技術(shù)閉環(huán),人形機(jī)器人的商業(yè)化進(jìn)程的最大問題,也只剩下成本了。
就如同特斯拉Optimus此次在9月視頻中所展現(xiàn)的,如同科幻短片一樣的場景,是我們多年之前對(duì)機(jī)器人交互的期盼和想象。
人們已經(jīng)不滿足于機(jī)器人只作為“機(jī)器”存在,在大模型加持下的AI領(lǐng)域,人們迫切需要更加符合人機(jī)交互理念的產(chǎn)品出現(xiàn)。
如今商業(yè)化的應(yīng)用場景,讓很多人看到了人形機(jī)器人的未來。除開互聯(lián)網(wǎng)公司不談,就連物流領(lǐng)域的部分企業(yè),都想進(jìn)軍人形機(jī)器人領(lǐng)域。然而實(shí)現(xiàn)商業(yè)化,卻不像許多人想的那樣簡單。
首先就是研發(fā)成本的高昂和遙遙無期的回本周期,如今年2月,人形機(jī)器人公司優(yōu)必選科技向港交所提交的招股書中提到,在研發(fā)周期的33個(gè)月中,優(yōu)必選的同期開發(fā)虧損來到了24.03億元。僅研發(fā)方向上,支出就高達(dá)12.7億元。
也就是說,項(xiàng)目利潤超過一半以上,都要投入到研發(fā)的“無底洞”中。不僅如此,算力的需求也是商業(yè)化不可避免的問題。
機(jī)器人全身的關(guān)節(jié)和傳感器,需要依托算力的統(tǒng)一。這也就意味著,動(dòng)態(tài)系統(tǒng)極為復(fù)雜的機(jī)器人,即便做出一些簡單的動(dòng)作,在單位時(shí)間需要輸入的算力也是極為驚人的。這還沒有考慮到復(fù)雜場景中,障礙所增加的難度。
其余類似安全系數(shù)以及信息安全等問題,都是短期內(nèi)無法妥善解決的問題。人形機(jī)器人是風(fēng)口,然而如果一味的在技術(shù)尚不成熟的現(xiàn)階段過度吹捧,都不利于人形機(jī)器人新時(shí)代來臨前,讓產(chǎn)業(yè)度過難關(guān) 。
從“圈地自萌”到商業(yè)落地,人形機(jī)器人領(lǐng)域需要真正的“未來可期”。
編輯/王沖