Jeff De2021谷歌年度 Jeff( 八 )


其他 ML 算法已被用于评估 ML 加速器芯片本身的计算机架构决策的设计空间。
谷歌还表明,ML 可用于为 ASIC 设计快速创建芯片布局,这些布局优于人类专家生成的布局,并且可以在几小时而不是几周内生成。这降低了芯片的固定工程成本,并降低了为不同应用快速创建专用硬件的障碍。他们在即将推出的 TPU-v5 芯片的设计中成功地使用了这种方法。
这种探索性 ML 方法也已应用于材料发现。在 Google Research 和加州理工学院的合作中,几个 ML 模型与改进的喷墨打印机和定制的显微镜相结合,能够快速搜索数十万种可能的材料,发现了 51 种以前未表征的三金属氧化物材料,在电池技术和水电解等领域具有应用前景。
这些自动化的设计空间探索方法可以帮助加速许多科学领域,特别是当生成实验和评估结果的整个实验循环都可以以自动化或大部分自动化的方式完成时。Jeff Dean 表示,希望看到这种方法在未来几年在更多领域中发挥良好的效果。
在健康领域的应用
除了推进基础科学,机器学习还可以更广泛地推动医学和人类健康的进步。
利用计算机科学在健康方面并不是什么新鲜事——事实上,谷歌早期就开发软件来帮助分析流行病学数据。但是机器学习打开了新的大门,带来了新的机会,也带来了新的挑战。
以基因组学领域为例。自基因组学问世以来,计算一直很重要,但 ML 增加了新功能并推翻了旧范式。当谷歌研究人员开始在这一领域工作时,许多专家认为使用深度学习帮助从测序仪输出推断遗传变异的想法是牵强附会的。
今天,这种机器学习方法被认为是最先进的。但未来对于 ML 来说将扮演更重要的角色——基因组学公司正在开发更准确、更快的新测序仪器,但也带来了新的推理挑战。
谷歌发布的开源软件 DeepConsensus 以及与 UCSC 合作的 PEPPER-DeepVariant 支持这些具有尖端信息学的新仪器。
Jeff De2021谷歌年度 Jeff
文章插图

图注:DeepConsensus 的 Transformer 架构示意图,可纠正测序错误以提高产量和准确性。
除了处理测序仪数据之外,还有其他机会使用 ML 来加速研究人员将基因组信息用于个性化健康。广泛表型和测序个体的大型生物库可以彻底改变人们理解和管理疾病遗传易感性的方式。
Jeff Dean 等人基于 ML 的表型分析方法提高了将大型成像和文本数据集转换为可用于遗传关联研究的表型的可扩展性,他们的 DeepNull 方法更好地利用大型表型数据进行遗传发现,并且已经开源。
Jeff De2021谷歌年度 Jeff
文章插图

图注:生成解剖和疾病特征的大规模量化以与生物库中的基因组数据相结合的过程。
正如 ML 帮助研究人员看到基因组数据的隐藏特征一样,它也可以帮助发现新信息并从其他健康数据类型中收集新见解。疾病诊断通常是关于识别模式、量化相关性或识别更大类别的新实例——这些都是 ML 擅长的任务。
谷歌研究人员已经使用 ML 解决了广泛此类问题,但也许这些问题都没有比 ML 在医学成像中的应用更进一步。
事实上,谷歌 2016 年的论文描述了深度学习在糖尿病性视网膜病变筛查中的应用,被美国医学会杂志 (JAMA) 的编辑选为十年来最具影响力的 10 篇论文之一——不仅仅是机器学习和健康方面最有影响力的论文,甚至是整个十年中最具影响力的 JAMA 论文。
Jeff Dean 表示,其团队成员希望看到这种相同模式的辅助 ML 系统被部署用于改善乳腺癌筛查、检测肺癌、加速癌症放射治疗、标记异常 X 射线和分期前列腺癌活检。