显示器|毫末智行AI DAY:智算中心,五大模型,以及新的天花板

显示器|毫末智行AI DAY:智算中心,五大模型,以及新的天花板

文章图片

显示器|毫末智行AI DAY:智算中心,五大模型,以及新的天花板

文章图片

显示器|毫末智行AI DAY:智算中心,五大模型,以及新的天花板

文章图片

显示器|毫末智行AI DAY:智算中心,五大模型,以及新的天花板

文章图片

显示器|毫末智行AI DAY:智算中心,五大模型,以及新的天花板

文章图片

显示器|毫末智行AI DAY:智算中心,五大模型,以及新的天花板
作者 / 曹锦
2022年 , 可谓是自动驾驶的「多事之秋」 。 在多家相关企业趋于低调时 , 毫末智行(以下简称「毫末」)仍保持着每季度举办一场AI DAY的节奏 。 而且从去年的内容来看 , 几乎每场都会宣布一新的技术突破和实质进展 。

在1月5日的第七届HAOMO AI DAY上 , 之前毫末透露的智算中心终于露出了真貌:它被命名为雪湖·绿洲(MANA OASIS) , 每秒浮点运算达到 67 亿亿次 , 拥有2T/秒的存储带宽 , 以及800G/秒的通信带宽 。 这意味着 , MANA就此进入了一个质变的阶段——以百卡周级别的成本、提升百倍的效率 , 完成千亿参数规模大模型的训练 。

(毫末董事长 张凯)
毫末董事长张凯在AIDAY上表示 , 2023年自动驾驶将全面进入3.0时代 。 在这一观点和智算中心发布动作的背后 , 对应的是毫末五大模型的全新形态 , 以及车端感知架构的跨代升级 。
「2000张GPU越快撑不住越好」
「超算中心会成为自动驾驶企业的入门配置 。 」张凯在对2023年的自动驾驶行业趋势预测中这样表示 。

(毫末CEO 顾维灏)
继与阿里云在云端计算方面合作之后 , 毫末本次与火山引擎合作开发了MANA OASIS 。 据毫末CEO顾维灏介绍 , 每台服务器配置8个GPU卡 , 毫末基于Sparse MoE , 根据计算特点进行稀疏激活 , 实现单机8卡即可训练百亿参数大模型的效果;另外 , 该中心通过600G/s的双向NVSwitch进行通信 。 另外 , OASIS服务器之间通过4张200G带宽的RDMA网络互联 , 提供高达800G/s的网络带宽 。

据毫末技术副总裁艾锐介绍 , 第一期的智算中心规格超过2000张GPU卡 , 后续还会视业务发展速度增加 。 「我们希望它越快撑不住越好 。 」
在过去两年的时间中 , 毫末研发出了全套面向大规模训练的Data Engine , 实现百P数据筛选速度提升10倍、百亿小文件随机读写延迟小于500微秒 。 同时 , 通过跨机共享expert的方法 , 完成千亿参数规模大模型的训练 , 训练成本可降至百卡周级别 。
目前 , MANA OASIS训练效率提升了100倍 。

建设智算中心的紧迫性和必要性 , 来自于毫末对毫末智能驾驶业务的超前预判 。 这次发布会上 , 除了智算中心的发布 , 毫末还宣布了要在2024年让城市NOH落地百城 。 据介绍 , 城市NOH系统软件已经达到交付状态 , 同时开启多城路测 。
在智能驾驶产品能力迭代铁三角方法论的基础上 , 张凯这次进一步介绍了毫末数据驱动体系 , 从六大闭环能力上透露了毫末产品快速迭代和量产的经验 。
截止2022年底 , 毫末HPilot搭载车型近20款 , 用户辅助驾驶行驶里程突破 2500万公里 。 MANA学习时长42万小时 , 虚拟世界驾龄相当于人类驾驶5.5万年 。
在这样的发展节奏和数据计算需求背后 , 是毫末结合五大模型的技术逻辑走出的「重感知、轻地图」的路线 。
「机器能做到的 , 就不用人工」