商汤首付56亿!上海建成亚洲最大AI“发电厂”,搞定万亿参数模型( 二 )


商汤首付56亿!上海建成亚洲最大AI“发电厂”,搞定万亿参数模型
文章插图
因此,AIDC既能独立作为智算中心、也能作为大装置的基石运行。
从智算中心角度而言,商汤AIDC最近加入了国家(上海)新型互联网交换中心,不仅能提供网络服务,本身也能作为算力云平台进行使用。
事实上,在AIDC正式对外开放之前,商汤内部就已经在它基础上,训练出了不少成功的算法案例。
例如,最近刚发布的“书生”模型(INTERN),覆盖了分类、目标检测、语义分割、深度估计四大视觉核心任务,就是在AIDC上训练出来的。
相较于OpenAI的CLIP,“书生”只需要10%的下游数据,就能超过CLIP基于完整下游数据的任务准确率,很好地hold住了数据量不足的长尾场景、以及通用大模型的需求场景这两大问题。
商汤首付56亿!上海建成亚洲最大AI“发电厂”,搞定万亿参数模型
文章插图
而作为大装置的一部分,商汤AIDC在面对产业、科研和政府的“AI+”需求时,又能很好地作为一个物理平台去生产和运行AI模型。
其中,产业中的大量传统行业,就能借助大装置更快地完成数字化转型;政府则能利用AI进行城市治理、打造智慧乡村;而针对如今AI for Science场景,像生物方向的蛋白质结构预测、或是理化方向的公式推导等,大装置同样能帮助科研机构实现一整套用AI算法完成理论实验的流程。
商汤首付56亿!上海建成亚洲最大AI“发电厂”,搞定万亿参数模型
文章插图
当然,这些还都只是从定义上来看,AIDC所能实现的基础能力。
从商汤角度来说,这一整套自建的AIDC,相对于其他的智算中心究竟有什么优势?
“商汤版”AIDC,有何优势?主要有五大核心竞争力。
其一,高弹性算力。
作为一年AI顶会发表五十余篇论文、有“算法工厂”之称的商汤,从算法角度对于各种模型的硬件训练和需求有自己的话语权。
小到某一特定任务的算法模型,大到百亿参数的通用模型,研究人员都需要在AIDC上运行,这方面的经验商汤已经积累成了一个算法平台,也因此能让AIDC的算力在最大程度上被充分利用。
用商汤副总裁杨帆的话来说就是:“我们的AI算法科学家会对硬件算力提出需求,所以知道这个智算中心最好要做成什么样子。”
商汤首付56亿!上海建成亚洲最大AI“发电厂”,搞定万亿参数模型
文章插图
其二,低算力成本。
一方面,商汤通过提升软件平台的兼容性,来适配各种国产硬件,从而实现成本降低。也就是无论模型在哪个牌子的硬件上训练或推理,商汤的平台都能兼容,这就使得在供应链上能取得话语权,从而降低硬件成本。
另一方面,商汤对于AI数据的存储进行了一个针对性的设计,相比于过去的结构化数据,商汤自研的存储系统能针对性地根据特定类型的任务,提速AI数据的存取。
其三,高安全性。
商汤AIDC针对隐私计算做了大量工作,包括沙箱和多方安全计算等,不仅能做到数据的网络隔离,而且能做到物理隔离。
同时,针对数据使用权进行了一个界定,最大程度上确保客户的数据不被泄露、或是在确保隐私的情况下被合理使用。
商汤首付56亿!上海建成亚洲最大AI“发电厂”,搞定万亿参数模型
文章插图
其四,低网络时延。
对于AIDC本身而言,接入国家(上海)新型互联网交换中心不仅让访问时延更低,而且意味着整体网络服务成本更低,质量更高;
同时,对于大装置而言,AIDC的集群网络设计基于RDMA(高速通信网络)技术,又能进一步提升模型训练的速度。
其五,低碳性。