chatgpt|想刁难ChatGPT?没想到破防的是小编!权威专家科普来了!( 二 )


ChatGPT更多地则是实现开放域的对话、输出写作内容等 。 跟以前的聊天机器人比 , ChatGPT最让人印象深刻的就是能用像模像样的人话来回答几乎任何领域的用户问题 , 并对上下文有一定程度的理解 。
chatgpt|想刁难ChatGPT?没想到破防的是小编!权威专家科普来了!
文章插图

资料图:美国企业家埃隆·马斯克 。
中新网:
一些人以 从0到1、划时代的革命性突破 来形容ChatGPT, 美国富豪埃隆·马斯克也发文称ChatGPT好得吓人 。 您认为ChatGPT有那么厉害吗?其创新性体现在哪些方面?
聂再清:
ChatGPT在算法层面一个比较重要的创新 , 就是把强化学习引入到大模型的训练和使用上 。 之前实现开放域对话的最大困难 , 在于用户输入的话题各种各样 , 任务空间太大 , 很难有足够的监督信号拿来训练 。
那么 , 如今ChatGPT通过利用人类反馈信号学习到的奖励模型(reward model) , 来为任意一个问题自动估算监督信号 , 充分利用强化学习的尝试探索(exploration)能力来解决开放域任务空间太大的挑战 。 这是一个比较好的创新应用 。 它在回答开放域问题时基本上能做到逻辑上比较通畅 , 句式上也像模像样 , 这不是很容易就能做到的 。
同时ChatGPT用到的GPT3.5 , 作为一个基础语言模型的质量也是非常高的 。 这需要大量的数据预处理工作 , 需要把各领域的语料整理好喂进大模型 , 在训练过程中不断积累能力 , 才能产生一个如此高效的基础语言模型 。
另一个比较重要的能力 , 就是ChatGPT能拒绝回答一些它判断为不适合回答的问题 , 懂得拒绝 。 实际上之前一些聊天机器人在设计时 , 也会谨慎处理一些比较敏感的问题 , 以及跟人类主流价值观不契合的内容 。 ChatGPT也在不断提升这种能力 , 防范生产出敏感或有偏见的内容 。
chatgpt|想刁难ChatGPT?没想到破防的是小编!权威专家科普来了!
文章插图

ChatGPT的试用页面上 , 标注了偶尔可能输出错误、有害、有偏见信息;对2021年后的世界认知有限等说明 。
中新网:
大家体验后发现 , ChatGPT不是完美的 , 还是会出错 , 也就是一本正经地胡说八道 。 您认为它需要改进的方面有哪些?
聂再清:
ChatGPT进行开放域聊天最大的好处 , 是它什么话题都接得住 , 能一直聊下去 , 有连续性 。 但最大的坏处是 , 有时用户无法判断它是否正确 。 如果提问人对问题答案不了解的话 , 会觉得它答得不错;但对一些不常见 , 提问人又知道答案的问题 , 就会发现ChatGPT有可能用一本正经的口气 , 编出了错误答案 。
因此 , 不看具体知识点的话 , ChatGPT似乎回答得很专业 。 但它目前难以真正理解和回答开放域里有具体知识点的问题 , 在处理开放域的问题上实际上还是基于概率 , 基于前一个值来生成下一个值 。 要通过图灵测试 , 还要继续努力 。
中新网:
ChatGPT是把所有输入给它的信息复制、堆砌起来 , 还是能生成原创内容?它有创造力吗?
聂再清:
可以视为ChatGPT是在搞创作 , 因为这是它经过大量学习后 , 基于概率自己产生的内容 。 让它写一封邮件、一首诗 , 也可以输出看上去长得很像用户所要求的东西 。
但比如去写论文、搞数学论证、去做实验并得出结果 , 它现在应该还没有那么强大 , 还不能系统地提出具有创新性的观点 , 但是它输出的一些内容可能会对科研工作带来一些启发 。
chatgpt|想刁难ChatGPT?没想到破防的是小编!权威专家科普来了!