特斯拉CEO埃隆·马斯克在推特上预告,将在9月30日的特斯拉人工智能日上发布原型机。它叫“擎天柱”(Optimus),又被称为“特斯拉人形机器人”(Tesla Bot),是特斯拉今年最重要的产品。 人形机器人的出现可以赋能千行百业,是人工智能场景的下一波浪潮,随着技术的不断成熟和商业化落地,有望带来万亿级别的空前蓝海。

当地时间6月3日,特斯拉CEO埃隆·马斯克在推特上预告,将在9月30日的特斯拉人工智能日上发布原型机。它叫“擎天柱”(Optimus),又被称为“特斯拉人形机器人”(Tesla Bot),是特斯拉今年最重要的产品。

人形机器人的出现可以赋能千行百业,是人工智能场景的下一波浪潮,随着技术的不断成熟和商业化落地,有望带来万亿级别的空前蓝海。

本期的智能内参,我们推荐华西证券的报告《Tesla Bot: AI的星辰大海》,解析人形机器人的市场前景。

来源 华西证券

原标题:

《Tesla Bot: AI的星辰大海

作者:刘泽晶

一、AI新篇章,人形机器人

特斯拉或将于 2022年9 月 30日推出首款人形机器人原型机,并将其命名为 ” OPTIMUS”。早在2021年8月19日,马斯克在特斯拉人工智能日时提出推出人形机器人,旨意是解决从事重复性高、单调枯燥的危险差事。

马斯克宣布进军AI机器人领域,意味着特斯拉绝不只是一家电动车公司,而是一家 AI公司。此外马斯克声称特斯拉机器人有朝一日随着时间推移将比汽车公司更加重要。

特斯拉机器人可以简单拆分2个域,即AI域及技术域

AI域: 采用FSD computer作为算力核心,配备8个Autopliot Cameras作为传感器,支持深度学习、大数据分析,Dojo训练,自动标记等算法。

技术域:机器人头部包含信息屏幕,用来展示信息,此外机器人由轻质材料组成,并且四肢包含40个左右的机电执行器,并通过力反馈感应系统来实现平稳和敏捷双脚行走。

据马斯克介绍,该机器人大约1.73米,体重约56.7千克,可抱起约20.4千克的货物最快行走速度可约达8KM/时。

AI域是人形机器人的核心,因为机器人只有通过不断的机器学习的训练,才能完成指定的任务。此外特斯拉人形机器人是特斯拉自动驾驶的集大成者,因为人形机器人的核心与智能驾驶共用 FSD系统,我们预计智能驾驶很多神经网络系统将会应用在人形机器人中。

数据是实现智能驾驶和智能机器人的根基,而算力为机器学习、神经网络提供基础动力,随着特斯拉所处理的数据指数级的增长,公司由于耗电问题放弃Nvidia A100 GPU作为超级电脑的阵列去做训练,而是凭借自身强大的垂直整合能力,研发出专注于深度学习训练的Dojo D1芯片,于是特斯拉Dojo超级电脑应运而生。

1、大脑:D1芯片

D1芯片作为 Dojo超级计算机的关键单元,实现了超强算力和超高带宽,实现了空间和时间的平衡。该芯片采用分布式结构和7纳米工艺,搭载500亿个晶体管、354个训练节点,仅内部的电路就长达17.7公里。

Dojo超级计算机实为 ”性能猛兽 ”,算力高达s 9PFLOPs 。Dojo超级计算机的训练模块由1500个D1芯片组成,共53万余训练节点,相邻芯片之间延迟较低,配合特斯拉自创高宽带、低延迟的连接器,算力高达9PFLOPs,是世界上首屈一指的超级计算机。与业内相比,同成本性能可提升4倍,同能耗性能可提高1.3倍,占比空间节省五倍。

特斯拉DOJO1芯片示意图

特斯拉 Dojo D1芯片主要可以拆解成4个部分,即CPU、 Switch、 Matmult、 SIMD。

CPU即中央处理器,是计算机系列的运行和控制核心,是信息处理、程序运行的最终指令单元。

Switch即交换器,是计算机芯片与芯片之间的桥梁,具有数据传输功能。

SIMD即单指令流多数据流,可以理解成平行计算,是采用一个控制器来控制多个处理器,介入实现空间并行性的技术,简单来说是一个指令可以处理多个数据。

Mat mult 即计算单元,可以专注于神经网络的计算,进而加速神经网络的计算速度,是特斯拉计算机实现算力猛兽的根本原因之一。可以将该计算单元可以理解成人工智能芯片,即AI处理器,是一款芯片专门用于机器学习的算法及神经网络的运算,可用于训练和推理。相较于同期的CPU和GPU相比,可以实现15-30倍的性能提升,以及30-80倍效率(性能)提升。

Dojo D1芯片架构

2、灵魂:AI机器视觉

机器视觉是 AI深度学习的一种应用与技术方向,无论是人形机器人还是智能驾驶都是机器视觉的落地方向之一。

神经网络是实现 AI深度学习的一种重要算法,覆盖人形机器人从识别到生成指令的全流程。是通过对人脑的基本单元神经元的建模和链接,探索模拟人脑系统功能的模型,并研发出的一种具有学习、联想、记忆和模式识别等具有智慧信息处理功能的人工系统。神经网络在智能机器人的应用广泛,主要应用在物体识别、规划、假设、训练/ /测试等各个环节。

神经网络最重要的特征是能从环境中学习,并把学习的结果分布存储在网络的突触连接中。神经网络是学习的一个过程。在环境的刺激下,相继给网络输入一些样本模式(input layer),按照一定的学习算法调整网络各层的权值矩阵(hidden layer),待网络各层权值收敛到一定值,学习过程会结束(output layer)。

特斯拉在智能驾驶和人形机器人在机器视觉的路径上具有异曲同工之妙。一套完整的训练、测试( (工作) )运动包含传感器、感知、评估、规划、制动器五个部分。

特斯拉机器视觉全流程示意图

特斯拉最著名的 AI算法是其机器视觉中的纯视觉解决方案,该算法在人形机器人的制造中将其延续。

基于图像的目标检测: 目的是确定图象中是否存在给定类别的目标实例,可以是动态或静态目标,如果存在,就返回每个目标实例的空间位置和覆盖范围。目标检测是解决分割、场景理解、目标追踪、图像描述、事件检测和活动识别等更复杂更高层次(时间记忆等)的视觉任务的基础。

2D物体识别到 3D物体识别的转换 : 特斯拉通过在8个不同位置的摄像头,得到不同角度的同一物体,在通过神经网络(类似NeRF算法)渲染出该物体的3D图像,并记录该物体的大小及位置;随后生成一个3D向量空间,通过鸟看图的方式,通过另一种神经网络(类似LSTM算法)和物体识别计算出物体下一时间点出现的位置,至此人形机器人完成全部的感知步骤,其中包含三维信息及时间维度信息,并将该信息存储在训练集中,并不断强化学习。

特斯拉2D物体识别到3D物体识别的过程示意图

二、前景广阔,蓄势待发

从智慧城市到智能驾驶 AI浪潮的变化,预计人形机器人为人工智能的下一落地应用场景。

大数据时代 : 2016年AI战胜柯洁,同时随着基础算力的提升,我国开启新一轮人工智能热潮即大数据时代。政策、资本先行,应用场景逐渐丰富。无人机、AI翻译机等相继落地。

智能驾驶 : 随着海量数据的陆续爆发,基础算力及芯片的陆续演进,特斯拉Autopilot凭借完善的功能定义、依靠数据不断学习的算法,以及通过OTA实现的软件升级,全球正式进入智能驾驶时代,同时,谷歌、百度、腾讯、华为等互联网巨头相继入局,推动智能驾驶加速发展。叠加政策持续推动自动驾驶商业化运营落地。如今,我国国内厂商在智能座舱、驾驶等发面都取得实际性的突破,未来国产化的生态将大有可为。

人形机器人 : 未来随着人形机器人的落地,枯燥乏味、重复性高例如买菜、家务等工作极易被人形机器人取代,我们认为这是人工智能的下一波浪潮,国内公司极大可能复制在智能驾驶领域取得的成果。

人工智能浪潮的变化

根据麦肯锡数据称,随着AI的不断进步,预计2030年全球约有3.75亿人口由于AI的技术突破将重新就业,从数量上看,我国将有1200万至1.02亿人口需要重新就业。全球平均被取代的劳动力比率为15%,我国作为人口大国基本与世界保持持平为16%。

此外,据马斯克透露人形机器人的实际成本不会很高,可能比汽车还低。安德鲁预测是25000美元,约人民币16万元。按照特斯拉MODEL3 最低售价约为28万元,保守估计Optimus售价为20万元。长期来看,保守估计,到 2030年全球人形机器人市场规模可达万亿规模,是继智能驾驶电车后又一 AI的空前蓝海。

人形机器人的出现可以赋能千行百业,有望取代重复性高、单调枯燥的繁琐工作任务,同时,搜索拯救等一系列危险问题工作有望得到解决,快递、家政、服务业、工业等一系列场景有望率先得到落地。此外,人形机器人是 AI场景的下一波浪潮,随着技术的不断成熟和商业化的落地,有望带来万亿级的空前蓝海,在我国智能驾驶的生态逐渐突破和成熟的背景下,人形机器人势在必行,国内公司极大可能复制在智能驾驶领域取得的成果。

具备自研 AI处理器的厂商可以为人形机器人的神经网络提供算力支撑。人工智能的本质及数据的海量运算,相较于AI算法,数据才是重中之重。算力作为数据加速处理的动力源泉,其重要性不言而喻。

根据机器学习的算法步骤,可分为训练和推断两个环节,训练环节需要极为庞大的数据输入才能支持一个复杂的神经网络模型,训练过程中由于复杂的神经网络结构和海量训练数据,运算量巨大,因此对于处理器的算力、效率(能耗)要求极大。

AI处理器芯片可以支持深度神经网络的学习和加速计算,相比于 GPU和 CPU拥有成倍的性能提升,和极低的耗电水平。此外,推断环节相较于训练环节的计算量相对较小,但依然会涉及大量的矩阵运算,因此,人工智能芯片将发挥大量作用。

人形机器人的落地需要下游场景的数据融合,具备 AI算法落地的厂商具有比较优势。特斯拉在智能驾领域已经实现了纯视觉的解决方案,相关FSD系统可以直接用于人形机器人的机器视觉领域。

然而距离人形机器人的商业落地,其数据需要和下游细分场景紧密结合,通过优质细分场景下的数据和算法进行不断地迭代训练,最后提供具有价值的商业服务。人形机器人在细分场景海量数据并不可以直接获得,而具备AI算法商业化落地的公司本身具备卡位优势,即与下游细分场景连接密切,双方可以通过合作共同赋能客户,进而加速人形机器人的商业化落地。

sitemap