机器人|特斯拉的最终形态：一家人工智能科技公司天眼查|槟榔碱|广电总局|宣传

文章插图
2021年8月20日，特斯拉AI日终于在预热了一个月以后正式开始了。
这次特斯拉依然没有让人失望，「一大堆」高科技技术展示了出来，包括，
神经网络算法技术、超级计算机ProjectDojo、D1芯片，真人形态的特斯拉机器人原型。
看了整场发布会，可以得出一个对特斯拉全新的认识，特斯拉虽然以汽车企业的形态存于市场，但Ta本质上是一家人工智能公司，而且特斯拉以数据、神经网络算法、超算平台构建了一条又宽又深的护城河。
下面展开聊聊。
纯视觉方案以及HydraNets
在AIDay之前的预热中Dojo出现的频次比较高，但在发布会正式开始后首先开讲的并不是期待已久的Dojo而是先介绍了纯视觉的自动驾驶方案以及背后的神经网络算法。
为了便于理解发布会中所讲的内容，我们必须先介绍一个背景：就是特斯拉自动驾驶方案的选择。
【机器人|特斯拉的最终形态：一家人工智能科技公司】我们都知道的是Autopilot系统是特斯拉自研的自动驾驶系统，这套系统最大的特点是采用视觉感知方案，从Autopilot1.0到现在的FSDBateV9.0版本这套系统的变化则是，特斯拉取消了系统中的雷达，将用摄像头视觉和深度神经网络来支撑整个系统的运行，V9版本FSD已经切换到了纯视觉。
而取消雷达让市场对与特斯拉自动驾驶的能力以及安全性提出来质疑，大部分人认为摄像头有天然的不足，感知融合方案则是传感器之间的相互补充，从而达到对环境感知能力的最优化。
而今天特斯拉就介绍了，Ta如何利用纯视觉感知和深度神经网络来实现高级别自动驾驶。

文章插图
首先开讲的是特斯拉AI总监AndrejKarpathy博士，他介绍，
特斯拉纯视觉自动驾驶系统通过8个1280×96012-BitHDR36Hz摄像头的数据输入进单个神经网络中，整合成3D环境的感知，这被称为VectorSpace。
特斯拉纯视觉方案，
基本构建原则是把自动驾驶系统看作一个生物，有眼睛、有神经、有大脑。
他们从头设计了神经网络，按照生物视觉方法去建模，并利用多头路线，其中包括相机校准、缓存、队列和优化以简化所有任务。
简单理解就是，特斯拉在设计汽车中的视觉时，是按照人眼感知生物视觉的方式进行建模，那么全车8个摄像头的数据会输入到一个矢量空间内，经过神经网络计算时，自动驾驶电脑会不断缩小分辨率，同时提升通道数量，通过不同的数据输入创建不同的执行结果用于不同的功能和目的。

文章插图

文章插图
目前，纯视觉与采用感知融合的明显出现了区别，特斯拉在纯视觉上越走越远，但采用纯视觉就要解决有的问题，比如，多传感器融合算法的精密与优先权；还有就是摄像头能否展示真实的物理空间。
也就是说，去掉雷达后就要要求特斯拉用摄像头实现距离、速度、高度以及加速度等信息，用单纯的摄像头实现这些显然有困难，那么特斯拉的做法是利用深度神经网络来增加象限。

文章插图
这就要提到RNN（RecurrentNeuralNetwork循环神经网络），什么是RNN?
RNN是一种特殊的神经网络结构,它是根据「人的认知是基于过往的经验和记忆」这一观点提出的，RNN之所以称为循环神经网路，因为它是基于一个序列当前的输出与前面的输出也有关来处理信息。