GPT-4学会“自我反思”:测试表现提升达30%

admin 0 2023-04-06 15:09:43

早些时候,OpenAI正式对外展示了GPT-4多模态模型,展示了它相较此前GPT-3.5强大的性能。

但事实上,从近日放出的信息来看,

GPT-4最为强大的并不是它诞生时的能力,而是它能够像人类一样“自我反思”。

根据研究人员NoahShinn和AshwinGopinath在论文中的表述,他们开发了一种新的技术,能够让AI模拟人类的自我反思,并评估自己的表现。

这使得GPT-4在完成各种测试的时候,会增加一些额外的步骤,

让它能够自己设计测试来检查自己的答案,找出错误和不足之处,然后根据发现来修改自己的解决方案。

团队目前已经使用该技术对GPT-4进行了多种不同的性能测试。

在HumanEval测试中,GPT-4需要解决164个从未见过的Python编程问题,原本准确率为67%,使用反思技术后,准确率提升到了88%。

在Alfworld测试中,GPT-4则需要在各种不同的交互环境中,通过执行一些允许的操作,来做出决策和解决多步任务;使用反思技术后,AI的准确率从73%提高到97%,只有4个任务失败。

总体来看,基于这一技术,

GPT-4在高难度的测试中能够取得明显进步,提升达到了30%左右。

以上文章来源于快科技,转发的目的在于传递更多信息,并不代表本站观点,也不构成任何其他建议。

  • 版权声明:免责声明:本文来源网友投稿及网络整合仅代表文章作者的个人观点,与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺,请读者仅作参考,并自行核实相关内容。投诉邮箱:1765130767@qq.com。
  • 本文地址:http://www.wuliudaohang.com/jybk/21579.html
  • 上一篇:人生自古谁无死留取丹心照汗青的意思视频 人生自古谁无死留取丹心照汗青的意思
  • 下一篇:黯然伤神的背景音乐 黯然伤神
  • 相关文章
    返回顶部小火箭