早些时候,OpenAI正式对外展示了GPT-4多模态模型,展示了它相较此前GPT-3.5强大的性能。
但事实上,从近日放出的信息来看,GPT-4最为强大的并不是它诞生时的能力,而是它能够像人类一样自我反思。
根据研究人员Noah Shinn和Ashwin Gopinath在论文中的表述,他们开发了一种新的技术,能够让AI模拟人类的自我反思,并评估自己的表现。
这使得GPT-4 在完成各种测试的时候,会增加一些额外的步骤,让它能够自己设计测试来检查自己的答案,找出错误和不足之处,然后根据发现来修改自己的解决方案。
团队目前已经使用该技术对GPT-4进行了多种不同的性能测试。
在HumanEval测试中,GPT-4需要解决164个从未见过的Python编程问题,原本准确率为67%,使用反思技术后,准确率提升到了88%。
在 Alfworld测试中,GPT-4则需要在各种不同的交互环境中,通过执行一些允许的操作,来做出决策和解决多步任务;使用反思技术后,AI的准确率从73% 提高到97%,只有4个任务失败。
总体来看,基于这一技术,GPT-4在高难度的测试中能够取得明显进步,提升达到了30%左右。
郑重声明:此文内容为本网站转载企业宣传资讯,目的在于传播更多信息,与本站立场无关。仅供读者参考,并请自行核实相关内容。
-
盘扣式脚手架有哪些优点?四川远方模架告诉你答案!新浪网消息:四川远方模架科技有限公司位于四川省成都市,创建于2017年。公司拥有M60型盘扣脚手架总量达30000余吨,具有...
-
区块链如何跨越未来10年“十四五”时期,随着全球数字化进程的深入推进,区块链产业竞争将更加激烈。作为新兴数字产业之一,区块链在产业变革中发挥着重要作...
-
三人篮球将首登奥运舞台 国家三人男女篮签署反兴奋剂为实现东京奥运会兴奋剂问题“零出现”的目标,近日,中国篮协反兴奋剂委员会分别前往山东济南和上海崇明训练基地,为国家三人男、女...
-
华为MateBookXPro笔记本电脑2023款上架
2023-08-10 09:13
-
乘联会发布2023年7月汽车零售销量排名:比亚迪各项
2023-08-10 09:12
-
神舟电脑:8月26日举行成立22周年庆典暨新品发布会
2023-08-10 08:56
-
华为MateBook14S/16S2023笔记本32
2023-08-10 08:52
-
古尔曼:苹果今年iPhone15系列发布会仍采用预录
2023-08-10 08:16
-
一品能一根筋 铁棒能成针!
2023-08-09 19:24
-
《荒野大镖客:救赎》8月17日登陆索尼PS4、任天堂
2023-08-09 15:27
-
报告:2025年末我国“千亿城区”有望突破200个
2023-08-09 15:24
-
英伟达发布RTX5000/4500/4000工作站显
2023-08-09 15:18
-
讯飞智能办公本X3评测:AI加持的高效商务神器
2023-08-09 15:09
最新