ChatGPT背后:一个天才、百亿融资和1亿月活|全球独角兽( 四 )


2022年 , 微软开始通过Edge浏览器和Bing搜索引擎在部分国家和地区提供基于AI图像生成工具DALLE开发的Imagecreator新功能 。 同年10月 , 微软宣布将推出视觉设计工具Microsoftdesigner 。
而今年公布的微软对OpenAI的第三次出手 , 彻底拉开了AI军备竞赛的帷幕 , 也标志着OpenAI新技术商业化进入了新的阶段 。
从现有结果来看 , 通过指数级增长的计算资源投入 , 来实现技术持续改进 , 以量变推动质变 , 这一以快制胜的路径是OpenAI在这一阶段作出的正确选择 。
对微软而言 , 不管OpenAI未来是否会在达成承诺的投资回报后拿回经营主动权 , 至少目前看来 , 微软已经靠“借力打力”在AI领域扳回一城 。
ChatGPT背后:一个天才、百亿融资和1亿月活|全球独角兽
文章图片
先做、砸钱、大厂资源一样不落 , Google为什么步步被压?诚如上文所言 , 在OpenAI造梦途中 , 和SamAltman的掌舵同样不可或缺的 , 自然是以“首选商业合作伙伴”身份入局的微软 。 也是因此 , 全世界关注者都无法不将“OpenAIx微软”与“DeepMindx谷歌”这两对“CP”做对比 , 而双方也更是如此 , 不少人推测 , 商业军备战已经拉开序幕 。 在OpenAI与微软的“步步紧逼”之下 , Google早已一改ChatGPT刚发布时事不关己的态度:2022年底 , 从发布“红色警报” , 召开AI战略会议 , 到指导研发团队的工作重心向AI产品开发和发布倾斜 , 再到被曝出已退出一线多年的两位创始人紧急回归参与战术制定 , Google显然已经在战略层面上重视OpenAI和微软对公司核心业务和市场地位的威胁 。 战略紧急调整 , 反映到行动上 , 更值得玩味:今年1月 , 被Google收购的DeepMind宣布ChatGPT竞品Sparrow内测版将于本年度上线 。 英国金融时报2月3日报道 , Google已经向投资前OpenAI员工创办的初创企业Anthropic投资3亿美元;同时 , 在微软将推出内嵌ChatGPT的新版搜索引擎Bing这一消息满天飞的情况下 , Google紧急宣布将于2月8日召开AI与搜索发布会 。 此外 , 就在2月6日——发布会即将举行的两天前 , GoogleCEOSundarPichai提前透露 , 基于LaMDA开发的AI对话服务Bard将和轻量版本的LaMDA一同发布 。 LaMDA是Google2021年5月推出的 , 专攻对话生成的大型语言模型 。 此时 , 距离LaMDA的首次发布 , 已经过去了近两年 。 LaMDA发布时间早于ChatGPT一年多 , 介于OpenAI推出GPT-3和InstructGPT的时间点之间 。 InstructGPT是OpenAI基于GPT-3微调得出的优化模型 , 在模型训练中加入了人类评价和反馈数据来实现强化学习 , 以产出更简洁易懂的自然语言文本 。 LaMDA能够调用的参数量与GPT-3旗鼓相当 。 和ChatGPT一样 , LaMDA可以为用户提出的问题提供更自然、更合理的回答 。 同时 , 相较于ChatGPT , LaMDA还具备实时调用外部知识源的能力 , 这一特征也将赋予Bard优于ChatGPT的时效性价值 。 由于ChatGPT模型训练未涵盖2021年之后的数据 , 其目前无法提供这样的基于实时信息的回答 。 事实上 , 仔细梳理OpenAI和Google在大型语言模型研发方面的成果线 , 不难发现 , 近年来双方一直呈现势均力敌的扭打态势 。 甚至在大型语言模型领域 , Google才是那个更早一步有所作为的一方 。 ChatGPT背后:一个天才、百亿融资和1亿月活|全球独角兽
文章图片
Google与OpenAI大型语言模型研发大事记
2017年6月 , Google推出了能调用6500万参数的Transformer模型 , 并将模型首次用于理解人类语言 , 开创了自然语言处理的新篇章 。 OpenAI的自然语言模型GPT系列以及DeepMind推出的能够预测蛋白质3D结构的AlphaFold , 都是在Transformer模型的基础上构建的 。 如此看来 , 从技术、资金实力 , 以及研究团队层面来看 , Google都并不逊于OpenAI 。 既然如此 , 是什么延缓了Google开放LaMDA , 推出AI聊天机器人的步伐 , 以至于陷入了OpenAI反客为主的被动境地?究其原因 , Google在研发和成果应用两个层面做出了与OpenAI截然不同的决策:赛马、创新VS小步快跑、专一 。 造成这一决策差异的 , 是两家公司本身的特征 , 包括公司固有的组织形式和现有市场地位等 。 在研发层面 , 尽管在2018年到2021年间 , 双方都注重通过增加模型规模来实现性能提升 , 但Google内部研发团队采用赛马制 , 也就是同时有多个进行类似研究的团队 。 因此 , Google对Transformer模型变体的研究以及相关垂直领域工具的研发是多线并行的 , 即从不同方向进行探索 。 这也使得虽然Google研究产出较多 , 创新性较高 , 采用的具体技术路线差异较大 , 但是缺乏聚焦 , 以至于一些研究成果仅仅停留在学术层面 , 而未能进行下一步应用 。 而OpenAI选择了小步快跑的专一路线 , 即OpenAI专注于在GPT系列上实现模型性能的迭代提升 , 以及基于GPT系列的垂直领域工具研发 。 OpenAI于2016年确立了两个主要目标:制造通用机器人和使用自然语言的聊天机器人 。 但是 , 从GPT-1发布之后 , OpenAI逐渐将所有重心转向大型语言模型的研发上 。 有了研究聚焦 , 在一定程度上加速了研发和技术商业化进程 。 在成果应用层面 , 创业公司的步子反而迈得会更大 , 与微软结盟后 , OpenAI采取了更加激进的新技术商业化策略 , 进一步将大量精力投入到能够迅速实现商业化应用的新技术研发和新产品开发方面 。 这也是OpenAI员工出走的原因:在模型尚不完善的情况下 , 就急于进行商业化落地 。 而有趣的是 , 部分Google员工出走的原因恰恰又是Google在新技术商业化方面过于保守 。 保守的原因之一是风险规避 , 包括由于生成内容可能产生种族偏见、性别歧视等有害内容的道德风险 , 用于训练的数据可能涉及的版权、引用溯源等法律风险 , 以及由于生成内容包含虚假信息而损害用户对公司信任度的风险 。 考虑到上述潜在风险 , Google一直对AI聊天机器人、AI图像生成工具等产品及相关模型的开放持谨慎态度 。 背靠Google的DeepMind也是如此 。 以至于 , LaMDA和Sparrow两个大型语言模型 , 以及Imagen、Parti、Muse这三个文本-图像生成模型迟迟未上线 。 但光脚不怕穿鞋 , 一直以来都是如此 。 同样的风险OpenAI自然也会面临 , 但OpenAI的做法似乎表明其并不介意承担此类风险 。 当然 , 可能一部分原因是 , OpenAI确实在一定程度上保留了技术开源的初心 , 但也需承认 , 相较于Google , 缺钱烧的OpenAI更需要快速实现新技术商业化 。 商业落地后的种种事实也表明 , 种族偏见、缺乏真实性等问题以及艺术工作者、教育机构的批判并不会妨碍OpenAI加速新技术商业化的决策 。 2021年开始 , OpenAI陆续推出了DALL-E、Codex、ChatGPT这一系列基于GPT-3新的垂直领域应用 , 并试图通过直接提供相应工具或授权微软将其集成于现有产品中的方式来赚取收入 。 保守的第二个原因则更隐晦 , 对于核心业务和市场地位较为稳定的Google而言 , 需要更审慎地评估新技术商业化应用实际能够为公司创造的价值 。 除了涉及新技术商业化本身的成本收益权衡 , Google还需要考量其可能对现有核心业务的影响 , 比如新产品的推出是否会蚕食搜索引擎市场 , 进而影响Google的主要收入来源——背靠搜索引擎的广告业务 。 因此 , Google近年来主要将新技术用于现有产品的功能改进和优化 。 事实证明 , 在瞬息万变的商业战场 , 没人会替你的保守买单 。 Google真正急眼的原因 , 是看到ChatGPT迅速吸引用户的能力——ChatGPT上线仅5天用户量就突破100万 。 截止今年一月底 , ChatGPT月活用户已经突破1亿 。 这样的能力 , 在OpenAI决定向Google核心业务和市场地位发起挑战后 , 可能会对Google造成不可预料的负面影响 。 这样一来 , Google需要作出的权衡反而更加简单明了:相较于新技术商业化由于潜在风险、蚕食现有业务可能造成的经济损失 , 如果不这样做 , 是否将面临更大的 , 不可挽回的经济损失 。 Google的战略回应已经说明 , 此刻 , 在它看来 , 将新技术商业化可能对其核心业务造成的不良影响 , 远不及OpenAI和微软具有挑衅意味的竞争行为可能对其造成的毁灭性打击 。 至于Google能否迎头赶上 , 以及一系列战略回应将对其核心业务、商业模式带来何种影响 , 还有待时间考证 。根据微软和Google争先召开发布会这一行为来看 , 我们或许将很快得到这些问题的答案 。