埃隆·馬斯克在得克薩斯超級工廠的CNBC專訪中再次強調(diào),Optimus人形機器人將成為特斯拉產(chǎn)品線中的一顆璀璨明珠。為了支撐這一雄心勃勃的聲明,特斯拉官方Optimus社交媒體賬號發(fā)布了一段視頻,展示了Optimus在日常生活場景中的卓越表現(xiàn),這段視頻無疑是其能力展示中的巔峰之作。
視頻中,Optimus在家庭環(huán)境中大顯身手,無論是扔垃圾、使用清潔工具,還是撕紙巾、烹飪輔助,甚至是家居管理如開關(guān)窗簾,都顯得游刃有余。更令人驚嘆的是,它還能輕松地將一輛Model X的前連桿搬移到手推車上,展現(xiàn)了其強大的物理操作能力和精準度。
值得注意的是,Optimus執(zhí)行這些復(fù)雜任務(wù)的基礎(chǔ)是一個統(tǒng)一的神經(jīng)網(wǎng)絡(luò)。特斯拉Optimus團隊通過向機器人輸入大量人類執(zhí)行類似任務(wù)的第一人稱視頻數(shù)據(jù),使其能夠直接學習和模仿這些動作。這一創(chuàng)新方法不僅提高了機器人的學習效率,更為其快速掌握和完善新技能奠定了堅實基礎(chǔ)。
特斯拉Optimus項目副總裁Milan Kovac在社交媒體上分享了團隊的最新進展和未來規(guī)劃。他透露,團隊正致力于讓Optimus能夠直接從互聯(lián)網(wǎng)視頻中學習人類執(zhí)行任務(wù)的方式,這包括第一人稱視角、第三人稱視角以及隨機攝像頭拍攝的內(nèi)容。這一能力的實現(xiàn),標志著Optimus在智能學習方面取得了重大突破。
Kovac進一步解釋說:“我們最近在將人類視頻知識轉(zhuǎn)移到機器人上取得了顯著進展,目前雖然僅限于第一人稱視角,但這已經(jīng)讓我們能夠比僅依賴遠程操作數(shù)據(jù)更快地開展新任務(wù)。遠程操作不僅復(fù)雜,而且數(shù)據(jù)獲取有限?!彼麖娬{(diào),通過這一過程,Optimus正迅速涌現(xiàn)出眾多新技能,這些技能可以通過自然語言(無論是語音還是文本)進行調(diào)用,并由機器人上的單一神經(jīng)網(wǎng)絡(luò)統(tǒng)一處理。
展望未來,特斯拉Optimus團隊計劃進一步擴大其學習范圍,將第三人稱視頻的轉(zhuǎn)移學習納入其中,即利用隨機互聯(lián)網(wǎng)視頻作為學習材料。同時,他們還將通過在真實世界或合成世界(模擬/世界模型)中進行自我強化學習,進一步提升機器人的可靠性和性能。這一系列舉措無疑將推動Optimus向更高層次的智能和實用性邁進。