速度超高端GPU数百倍,摩尔定律的未来是「光」?( 二 )


这一答案有着强有力的论证 , 2016年 , MIT博士沈亦晨所在的研究团队打造出了首个光学系统 , 并在2017将这一成果发表在顶级期刊NaturePhotonics杂志封面上 。
其创新有二 , 硬件上用光干涉仪作为基本的矩阵运算单元有效取代传统电子晶体管 , 算法上开发了一系列在不牺牲性能条件下有效降低深度学习计算量并适应于光子芯片的算法 。
光子计算成果初现
这一实验成果的发布 , 启发了全球范围内一大批人开始关注光子AI芯片 , 沈亦晨本人也从MIT团队走向业界 , 创办了专注研发光子芯片相关技术的公司曦智科技(Lightelligence) 。
公司成立一年半之时 , 曦智科技成功开发出世界第一款光子芯片原型板卡 , 成功演示了用光子芯片运行GoogleTensorflow自带的卷积神经网络模型来处理MNIST数据集 , 即使用计算机识别手写数字的基准机器学习模型处理数据集 。 整个模型超过95%的运算都有在光子芯片处理完成 , 此原型板卡的问世向全世界证明了用光子代替电子进行AI计算的可行性 。
测试结果显示 , 光子芯片处理的准确率已经接近电子芯片(97%以上) 。
速度超高端GPU数百倍,摩尔定律的未来是「光」?】距离这块原型板卡发布不到两年 , 2021年12月 , 曦智科技又取得新进展 , 发布了高性能光子计算处理——PACE(PhotonicArithmeticComputingEngine , 光子计算引擎)——单个光子芯片中集成超过10,000个光子器件 , 运行1GHz系统时钟 , 运行特定循环神经网络速度可达目前高端GPU的数百倍 。
速度超高端GPU数百倍,摩尔定律的未来是「光」?
文章图片
“相比于2019年推出的那款原型板卡 , 我们的PACE在光子器件的集成度上大约提高了两个数量级 , 从100个光子器件到10000个光子器件;运行系统时钟提高四个数量级 , 基本达到目前电子芯片的时钟 。 ”沈亦晨说道 。
速度超高端GPU数百倍,摩尔定律的未来是「光」?
文章图片
值得注意的是 , PACE并不是纯粹的光子芯片 , PACE包含64x64的光学矩阵 , 核心部分由一款集成硅光芯片和一块CMOS微电子芯片以3D封装形式倒装堆叠而成 。 其中 , 电芯片主要用作数据存储和数模混合调度 , 光芯片主要用作数据计算 。
“我们认为 , 电存储技术 , 尤其在高速存储读取方面 , 会在很长一段时间之内领先于光 。 这也是我们采用光电协同的原因 。 ”沈亦晨解释道 。
PACE运行时 , 每个输入向量值首先从片上存储中提取 , 由数模转换器转换为模拟值 , 通过电子芯片和光子芯片之间的微凸点应用于相应的光调制器 , 形成输入光矢量 。
速度超高端GPU数百倍,摩尔定律的未来是「光」?
文章图片
接着 , 输入光矢量通过光矩阵完成运算传播 , 产生输出光矢量 , 并达到一组光电探测器阵列 , 从而将光强转换为电流信号 。
最后 , 电信号通过微凸点返回到电子芯片 , 通过跨阻放大器和模数转换器返回数字域 。
沈亦晨表示 , 曦智科技所使用的光调制器 , 是基于马赫曾德干涉仪方案做光与光之间的干涉 , 并同算法协同优化的小尺寸高速可调的光调制器 。 由于光在传播时不放热 , 完成矩阵运算花费时间少 , 延时低于电芯片 , 矩阵乘法并行能力更强 。
PACE采用迭代法来解决全球难以高效解决的数学问题——多项式复杂程度非确定性问题 , 涉及生物信息中蛋白质结构预测 , 物流交通调度、材料研发等问题 , 商业应用前景广阔 。
曦智科技也做出了自己产品规划 , 计划在自2022年开始的1到3年内 , 在对算力、延时痛点强的应用场景落地 , 例如金融和云服务厂商 , 之后加强对训练市场的布局 , 最后延伸至GPU、车载芯片等市场 。