显示器|毫末智行AI DAY：智算中心，五大模型，以及新的天花板显卡|数码

文章图片

文章图片

文章图片

文章图片

文章图片

作者 / 曹锦
2022年，可谓是自动驾驶的「多事之秋」。在多家相关企业趋于低调时，毫末智行（以下简称「毫末」）仍保持着每季度举办一场AI DAY的节奏。而且从去年的内容来看，几乎每场都会宣布一新的技术突破和实质进展。

在1月5日的第七届HAOMO AI DAY上，之前毫末透露的智算中心终于露出了真貌：它被命名为雪湖·绿洲（MANA OASIS），每秒浮点运算达到 67 亿亿次，拥有2T/秒的存储带宽，以及800G/秒的通信带宽。这意味着， MANA就此进入了一个质变的阶段——以百卡周级别的成本、提升百倍的效率，完成千亿参数规模大模型的训练。

（毫末董事长张凯）
毫末董事长张凯在AIDAY上表示， 2023年自动驾驶将全面进入3.0时代。在这一观点和智算中心发布动作的背后，对应的是毫末五大模型的全新形态，以及车端感知架构的跨代升级。
「2000张GPU越快撑不住越好」
「超算中心会成为自动驾驶企业的入门配置。」张凯在对2023年的自动驾驶行业趋势预测中这样表示。

（毫末CEO 顾维灏）
继与阿里云在云端计算方面合作之后，毫末本次与火山引擎合作开发了MANA OASIS 。据毫末CEO顾维灏介绍，每台服务器配置8个GPU卡，毫末基于Sparse MoE ，根据计算特点进行稀疏激活，实现单机8卡即可训练百亿参数大模型的效果；另外，该中心通过600G/s的双向NVSwitch进行通信。另外， OASIS服务器之间通过4张200G带宽的RDMA网络互联，提供高达800G/s的网络带宽。

据毫末技术副总裁艾锐介绍，第一期的智算中心规格超过2000张GPU卡，后续还会视业务发展速度增加。「我们希望它越快撑不住越好。」
在过去两年的时间中，毫末研发出了全套面向大规模训练的Data Engine ，实现百P数据筛选速度提升10倍、百亿小文件随机读写延迟小于500微秒。同时，通过跨机共享expert的方法，完成千亿参数规模大模型的训练，训练成本可降至百卡周级别。
目前， MANA OASIS训练效率提升了100倍。

建设智算中心的紧迫性和必要性，来自于毫末对毫末智能驾驶业务的超前预判。这次发布会上，除了智算中心的发布，毫末还宣布了要在2024年让城市NOH落地百城。据介绍，城市NOH系统软件已经达到交付状态，同时开启多城路测。
在智能驾驶产品能力迭代铁三角方法论的基础上，张凯这次进一步介绍了毫末数据驱动体系，从六大闭环能力上透露了毫末产品快速迭代和量产的经验。
截止2022年底，毫末HPilot搭载车型近20款，用户辅助驾驶行驶里程突破 2500万公里。 MANA学习时长42万小时，虚拟世界驾龄相当于人类驾驶5.5万年。
在这样的发展节奏和数据计算需求背后，是毫末结合五大模型的技术逻辑走出的「重感知、轻地图」的路线。
「机器能做到的，就不用人工」