Jurassic-X: 让神经模型学会符号推理( 二 )

文章图片
对标GPT-3的LLM:Jurassic-1
3混合系统尽管基于神经模型的方式获得了令人印象深刻的性能 , 不过GPT-3在涉及到一些哪怕是很简单的推理时也会犯一些低级错误 , 尤其涉及到比较复杂的语言描述 , 例如多个数相加;涉及到最新的消息 , 例如纽约现在的天气 。 它仅仅从过去训练好的数据中进行推断天气情况 , 难以迁移到新的场景下 , 而如果用更新的数据 , 则需要重新训练模型 , 而这需要巨大的代价 。

文章图片
不同专家系统之间的连接
因此MRKL使用了代表当代AI在商业角度下的第三个趋势——使用神经和符号结合的混合系统 。 MRKL融合了不同的模块 , 有些模块使用了深度学习 , 有些则使用符号推理模式的专家系统 , 例如直接从某些数据知识库中进行检索等模块 , 来获取更新的信息 。
MRKL中一个出色的设计被称作是路由(router)的模块 , 它可以根据用户的问题匹配一个专家系统:例如如果问题涉及到数学 , 它会转向一个计算器 , 如果问题涉及到汇率 , 它会路由到一个汇率转换器 , 如果是天气的话 , 它会转到一个天气网站等等;如果路由对于问题不确定 , 它会先通过Jurassic-1等语言模型利用上下文推断出应该转向哪个专家模块 。
4权重更新方式MRKL还采用了prompttuning的方式对于模型的下游任务进行更新 , 如上述 , 这种方式避免了灾难性遗忘的微调模式以及零样本学习的低性能 。 与传统的prompttuning方式相比 , Jurassic-X使用了更加精细的设计:(1)依赖于模型输入的prompt学习方式 。 (2)检索增强的prompt生成方式 。 (3)递归式地应用冻结了的LM模型 。 论文中做了更加详细的技术介绍 , 感兴趣的读者可以直接阅读论文 。

文章图片
MRKL中采用递归方式涉及promptlearning
5应用实例博客中介绍了几种MRKL的应用场景举例 , 都是一些值得关注和实用的一些话题 , 涉及到方方面面可能出现在日常场景中的问题 。
用人类语言去阅读和更新数据库

文章图片
问题:买玫瑰味的洗发水
Jurassic-X会从人类语言中提取中关键信息 , 并从商店清单中去检索产品 , 加入到购物车的数据库中 。 这在智能助理 , 电子商务等都有应用前景 。
对于当下问题的文本生成

文章图片
问题:谁是当下的美国总统
Jurassic-X会融合当下及时更新的外部数据库 , 例如维基百科去产生更及时的数据 。
数学操作

文章图片
问题:公司的655400份份额被94个员工平均分配 , 每个员工得到多少?
Jurassic-X会通过语言模型提出去关键信息 , 并且应该去寻找一个“数学专家” , 也就是计算器 , 从而得出正确结果 。
组合型问题

文章图片
问题:更多的人住在TelAviv还是Berlin?
Jurassic会将组合型问题分解为若干子问题:TelAviv的人口是多少?Berlin人口是多少?哪个数字更大?等 , 解决了每个子问题后再把它们汇总在一起 。 更重要的是 , 这样也增加了可解释性 , 说明了模型给出答案的依据 。
- atom|200块就能让手机出好声音,体验小尾巴内卷典范:atom mini
- 前段时间腾讯视频会员将再次涨价的消息让很多网友直呼肉疼|长视频和腾讯视频的区别在哪里?
- 机器人产品|九号公司把服务机器人价格公开透明化,让产品价格与价值相匹配
- 高通骁龙|骁龙888+66w快充,直降500元为新机让路?这款手机捡漏别错过
- 华为荣耀|2022年第一季度手机销量排名,小米仅第五,第二名让人意外!
- 硬盘|目前“实至名归”的三款旗舰机,配置几乎无短板,让人无法拒绝!
- |新技术让树上长出电子元件
- 苹果|618还远着呢,苹果就坐不住了,这让国产机怎么活?
- 马云|马云的“新身份”曝光,一年多次出入联合国,背后真相让人“意外”
- 联想Yoga|今天让我们一起来看看OPPO Find X5 Pro的超广角摄像头
