机器学习|百度闷声干大事

进入到 2022 年,生物科技领域动态不断。
仅过半个月,有 4 家生物科技相关公司被同一家企业投资;不仅如此,它所投的项目在《麻省理工科技评论》(MIT Tech Review )的十大突破性发明“AI 新药发现”板块占比过半……
这些动态的背后,都离不开一家互联网巨头:百度。
对于鲜少关注医学领域的人来说,很难将百度和生命科学进行联系,但从其近年来的种种举措来看,在生命科学领域,百度正“闷声干大事”。
百度 AI 落地的另一站对外界而言,百度 AI 落地最广为人知的场景在于自动驾驶领域,即百度 Apollo,但对于百度而言,其 AI 的野心并不止于此——对于生命科学领域,百度同样想吃下;不仅因为这是一个极具前沿性的方向,而且关系到李彦宏“最初的梦想”。
大约在 20-25 年前,李彦宏就对生物信息学挖掘人体秘密充满兴趣。
早在 90 年代,李彦宏在华尔街时便申请过生物信息研究相关的工作,据说当时已经拿到世界顶尖生命科学研究机构的 Merck(默克集团)的 offer。
不过,在他看来,当时的基因测序技术还非常初级,生物数据量和数据质量也不足以发挥计算的优势。
“如果那么多从事生命科学的人都不相信计算机能够对生命科学产生重要影响,那么靠我一个人力量恐怕也很难推动”,李彦宏事后回忆。
后来的事情也不难得知,李彦宏回国创立了百度,而后百度又在 AI 上迅猛发力,并在包括智能驾驶等领域进行落地实践。
但对李彦宏来说,他始终没有放下对生命科学的向往。李彦宏曾多次在公开场合提到计算机技术与生命科学相结合的可能性。
在他看来,基因测序是 IT 领域之外另一个高度契合摩尔定律的领域。“每隔 18 个月,计算机的计算能力提升一倍、成本下降了一半,经过几十年这样的速度发展,很多原来觉得不可能的事情变可能了”,李彦宏表示。
从基因测序的发展来看,的确如此。十几年前,基因测序需要花费 10 亿、20 亿才做出来。如今,每个人的基因测序只需花费 1000 美元左右。
即使当初想投身声明科学的“梦”被暂时搁置,但在很长一段时间里,李彦宏一直在尝试推动互联网技术和生命科学的结合,曾个人捐资 3000 万元与协和合作抗癌项目;跨界参与完成医学研究论文等。
2020 年 5月,李彦宏与其它学者共同研究的关于食管鳞状细胞癌的论文在权威医学期刊 Cell Research 杂志发表,题为《Whole-genome sequencing of 508 patients identifies key molecular features associated with poor prognosis in esophageal squamous cell carcinoma》。
除了李彦宏亲自上阵的种种举措,百度还在内部设立了一家 VC 基金——百度风投(Baidu Ventures),其中一大重要投资版块便是生物智能。
据不完全统计,百度风投过往投资的生物计算相关企业超过 50 家,涵盖 AI 药物发现、多组学数据、分子影像等诸多领域。
在多年的积累沉淀下,百度在 2020 年 1 月疫情爆发时就能够在第一时间开放线性时间算法 LinearFold——借助这一算法,疾控部门用 10 小时便完成了四个样本的全基因组测序。
随后,百度研究院又推出全球首个专门优化新冠病毒 mRNA 疫苗基因序列的高效算法 LinearDesign,可在 11 分钟内完成序列设计。
或许是新冠疫情的爆发让百度更加认识到互联网技术和生命科学结合的重要性,在 2020 年 8 月,百度研究院宣布成立生物计算实验室。
百度期望通过 AI 和计算技术,深化学术界和生物制药企业的合作,探索基因、DNA、RNA、蛋白质分子结构等人类生命密码,缩短新药研发周期,降低新药研发成本,提升药物和疾病匹配的精准度,发现基因和疾病的关联关系,从而实现精准医疗。