中信證券(600030)發(fā)布研報稱,特斯拉(TSLA.US)于9月24日發(fā)布官方視頻,更新了其人形機器人(300024)方面的進展。視頻顯示TeslaBot通過視覺和位置編碼器實現(xiàn)了肢體的校準(zhǔn),且展示了其人形機器人出眾的姿態(tài)控制能力。此次展示再次凸顯端到端算法在人形機器人應(yīng)用端的不斷成熟,且再次展示出特斯拉在數(shù)據(jù)量、算法及算力方面的優(yōu)勢。此外,其僅靠視覺、編碼器和IMU就完成了任務(wù),展現(xiàn)出超強的硬件控制能力。鑒于人形機器人可用數(shù)據(jù)集迅速攀升及算法、算力的不斷成熟,維持人形機器人行業(yè)“強于大市”評級,建議持續(xù)關(guān)注人形機器人板塊及相關(guān)廠商投資機會。
同時,鑒于端到端深度學(xué)習(xí)框架逐步完善,算法泛化能力持續(xù)增強,市場可調(diào)取數(shù)據(jù)集持續(xù)增加,機器人識別交互及執(zhí)行能力有望在數(shù)據(jù)快速量變的背景下加速實現(xiàn)質(zhì)變;且隨著控制端硬件規(guī)?;a(chǎn)的擴大及實用性研發(fā)的深入有望加速人形機器人本體的落地應(yīng)用。建議關(guān)注視覺/力學(xué)/IMU傳感器、位置編碼器、控制系統(tǒng)、關(guān)節(jié)/靈巧手、芯片及算法上市(擬上市)公司。
(資料圖片)
輸入端:特斯拉端到端模型輸入端為視頻信號,即圖像及音頻信號的混合輸入,但此次展示顯示其識別部分神經(jīng)網(wǎng)絡(luò)算法僅使用視覺信息
特斯拉于9月24日發(fā)布官方視頻,視頻內(nèi)容展示的算法凸顯出TeslaBot復(fù)雜真實條件下的分類分揀能力,且展現(xiàn)出對目標(biāo)擺放物姿態(tài)的精準(zhǔn)識別及糾正能力。盡管人形機器人與汽車在輸入視覺信息方面存在一定差異,但基于特斯拉基于V12自動駕駛的算法體系同時應(yīng)用于人形機器人及汽車是可行的,且有利于加速提升識別算法的泛化能力。此次視頻展示暫未提及所選用相機類別,基于目前圖像識別算法框架原理,我們認為此類識別2D及3D相機都可實現(xiàn),選配核心為成本控制因素,國內(nèi)視覺鏡頭及相機等核心零部件廠商已具備此類產(chǎn)品生產(chǎn)能力,產(chǎn)品配套方案及產(chǎn)品性價比值得關(guān)注。
輸出端:特斯拉人形機器人輸出端為信號及姿態(tài)控制
TeslaBot手指的靈活性在視頻中得到良好展示,其可以以人類速度完成抓取并分類,即使在快速變化的環(huán)境下其信號處理及關(guān)節(jié)控制依然保持良好反應(yīng)能力及較高輸出穩(wěn)定性,手指抓取力度同樣表現(xiàn)出較高水平。此外視頻同樣展示了TeslaBot出眾的姿態(tài)控制能力,其已可以初步展示部分類瑜伽動作。關(guān)節(jié)、傳感器、控制系統(tǒng)對輸出端穩(wěn)定性至關(guān)重要,盡管國內(nèi)廠商此類產(chǎn)品在產(chǎn)品產(chǎn)出一致性及可靠性存在一定短板,但產(chǎn)品升級迭代速度快,且此領(lǐng)域可選方案較多,不同廠商有望在不同價格段占據(jù)優(yōu)勢。
算法:特斯拉端到端學(xué)習(xí)框架不斷成熟,泛化能力持續(xù)增強。
端到端框架能夠直接從原始輸入端到最終輸出端進行訓(xùn)練,無需進行手動特征工程(manual feature engineering)或中間階段的處理,端到端依然利用深度神經(jīng)網(wǎng)絡(luò)能力,優(yōu)勢在于能極大程度減少手工設(shè)計組件,可以直接通過從原始數(shù)據(jù)中學(xué)習(xí),捕獲復(fù)雜關(guān)系和細微差別,而這些微妙之處可能很難通過手動特征工程來明確指定,這項優(yōu)勢可以提高性能、縮短開發(fā)周期并減少開發(fā)者對領(lǐng)域?qū)I(yè)知識的依賴;缺點在于所需數(shù)據(jù)量極大,數(shù)據(jù)收集成本及模型訓(xùn)練成本較高。盡管此視頻未展示其具體算法,但基于其輸入輸出信息,建議關(guān)注基于強化學(xué)習(xí)框架的機器人控制算法。
硬件:機器人“瑜伽”展現(xiàn)出超強的硬件控制能力, IMU、編碼器等傳感環(huán)節(jié)的重要性愈發(fā)顯現(xiàn)
特斯拉Optimus機器人在最新視頻中展現(xiàn)出較強的身體平衡能力,包括單腿站立時前后平衡能力和平行與身體方向的平衡能力,表明特斯拉機器人的靜態(tài)運動控制穩(wěn)定性以及用以控制平衡的IMU的較高精度。此外,特斯拉機器人的靈巧手表現(xiàn)更加靈活,身體控制更加順滑,表明了關(guān)節(jié)模組中的“雙編碼器”并非存在阻滯性較強的缺點,靈巧手中的編碼器也同樣具備較高精度。特斯拉機器人優(yōu)秀的硬件控制能力表明從硬件、傳輸再到軟件,其均較2023年5月官方團隊中展示的機器人有較多硬件優(yōu)化。
風(fēng)險因素:
人形機器人政策執(zhí)行及支持力度低于預(yù)期;國內(nèi)廠商及特斯拉人形機器人任務(wù)攻關(guān)進度不及預(yù)期;人形機器人市場需求低于預(yù)期;國產(chǎn)人形機器人產(chǎn)業(yè)化低于預(yù)期;人形機器人主流技術(shù)方案發(fā)生重大變化;國產(chǎn)機器人廠商響應(yīng)程度低于預(yù)期。
關(guān)鍵詞: