世界简讯:ChatGPT修bug横扫全场,准确率达78%!网友:程序员要开心了
金磊 衡宇 发自 凹非寺量子位 | 公众号 QbitAI
ChatGPT到底有多会修bug?
这事终于有人正儿八经地搞研究了——
【资料图】
来自德国、英国的研究人员,专门搭了个“擂台”来检验ChatGPT的这项本领。
除了ChatGPT之外,研究人员还找来了其它三位修bug的“AI猛将”,分别让它们修复40个错误代码。
结果真是不比不知道,一比吓一跳。
ChatGPT准确修复了其中31个bug,遥遥领先第二名(21个),直接拿下“AI修bug界”的SOTA成绩!
于是乎,这项研究引来了众多网友的围观和讨论,Reddit上发布此帖的标题更是用上了“小心”、“注意”这样的字眼:
但事实上,这真的会让程序员“危”吗?
我们不妨先来看下这项研究。
很会修bug的ChatGPT
虽然ChatGPT并非是为了专门修改bug而生,但自打它问世以来,不少网友们都发现它是具备这项能力的。
因此研究人员为了摸清ChatGPT到底能修改bug到什么程度,便引入了标准的错误修复基准集QuixBugs来进行评估。
以及与它同台竞技的AI选手,分别是CodeX、CoCoNut和Standard APR。
研究人员从QuixBugs中挑了40个问题,分别让它们来修复bug。
让ChatGPT来修bug的方法,就是在对话框里向它提问:
这个代码有什么错误吗?
在第一轮较量过后,结果如下:
从第一轮battle结果来看,ChatGPT修复了19个,CodeX修复了21个,CoCoNut修复了19个,Standard APR则是7个。
而且研究人员还发现,ChatGPT的答案与CodeX最为相似;这是因为它俩是来自同一个语言模型家族。
这时候就会有小伙伴要问了,“ChatGPT不是还没有CodeX厉害吗”。
别急,不要忘了,ChatGPT的一个特点就是越问越“上道”。
例如在这个基准集中,有一个叫bitcount的问题,ChatGPT在刚才第一轮修复过程中是给了错误的答案:
原本ChatGPT应该将第7行的 n ^ = n - 1 改为 n & = n - 1。
但在第一轮中它的回答是:
如果没有更多关于预期行为和导致问题的输入信息,我无法判断程序是否存在错误。
于是在给予它更多信息之后,ChatGPT便答对了这个问题。
以此类推,在对第一轮没答对的问题进行更多信息提示之后,ChatGPT的修bug能力有了大幅提高:
最终,ChatGPT在QuixBugs的40个问题里答对了31个。
网友忧喜参半
对于这样的实验结果,网友们对ChatGPT修bug拿下SOTA这事产生的态度却不太一样。
有网友认为这事不应该让程序员感到危机,而是会让他们觉得开心才对。
言外之意,便是程序员们有了这么好用的工具,干活儿就会变得事半功倍。
不过也有人对此给出了不一样的看法:
工作变得简单,不也就意味着需要的人力更少了吗?
但还网友觉得,活儿是干不完的:
即使AI能把开发时间缩短一个数量级,也只是意味着程序员将更快处理下一个工作。
整体来看,ChatGPT很会修bug,并不会给程序员带来什么致命伤害。
但若是把目光放到OpenAI其他的行动中呢?
全球招外包训练ChatGPT写代码
在此之前,OpenAI就表示过ChatGPT的重要用途之一是帮助程序员检查代码。
换言之,它被定位可用的辅助工具。
相比“ChatGPT带来威胁”的看法,等ChatGPT能力彻底进化,程序员都不用再怕写bug了。
OpenAI布局的棋盘上,可不只有改bug偷塔程序员岗位这一件事。
为了让它更大更强,OpenAI被曝在拉美和东欧等地区,提供了1000个外包岗位。
外包员工的主要工作是标注数据,以及训练ChatGPT写代码
这1000人中,40%是程序员,他们为OpenAI的模型创建数据,用来学习软件工程任务。
一直以来,OpenAI的训练数据是从GitHub上抓取的。
现在外包程序员们新手搓的数据集,不仅包括代码行,还包括代码行背后的人类思考逻辑步骤。
有位南美的软件开发人员爆料,他为OpenAI完成了五小时的无偿编码测试。
整个过程中,他的任务分为两部分。
用书面英语解释如何处理一个编码问题;提供解决方案。如果发现bug,OpenAI会向他详细询问bug的具体情况,并请教如何修正。
程序员需要展示思考问题的每个步骤,他据此猜测OpenAI很可能想为ChatGPT提供非常具体的训练数据。
特斯拉前AI主管Andrej Karpathy在推特上调侃:
最新的热门编程语言是英语。
不过话说回来,ChatGPT修bug能力强是好事,要真能搞进化到可以完成代码里死记硬背的部分,也是好事。
毕竟OpenAI成立时对外宣称的宗旨,就是希望“确保通用人工智能可以造福全人类”。
虽然乍一看它这些年做的事,有点像在致力于用一部分人的努力,让更多人失业。
从Dota2赛场上碾压人类,到GPT-3、DALL-E2、ChatGPT的闪耀表现,它带来的新产品总是伴随着“快要让xxx失业了”的议论声。
但无论如何,商业却一直对它青睐有加。
就目前而言,OpenAI的主要商业模式是API费用、token费用和软件许可。
OpenAI近期还发布了ChatGPT的付费版ChatGPT Pro,每月费用42美元(约合285元人民币)。
虽然机器人对话初创公司如雨后春笋般冒出,但诸多迹象表明市场对OpenAI的持续看好。
微软刚刚宣布将向OpenAI加码投资数十亿美元,并将OpenAI的模型融入微软必应等消费级和企业级产品中。
根据知情人士透露,此次追加投资数额约为100亿美元。
与此同时,WSJ披露的消息显示,1月初,亿万富翁Peter Thiel创立的风投基金Founders Fund正在就投资OpenAI进行谈判。
据悉,融资金额将至少达3亿美元。
One More Thing
在第一轮实验中,ChatGPT并没有解决QuixBugs数据集的bitcount问题。
但若是你现在再重头问一次这个问题,就会发现ChatGPT可以“一遍过”:
那么这是否意味着ChatGPT已经从这次研究过程中学会求解了呢?
[1] https://arxiv.org/abs/2301.08653[2] https://www.pcmag.com/news/watch-out-software-engineers-chatgpt-is-now-finding-fixing-bugs-in-code[3] https://www.reddit.com/r/technology/comments/10oaw6n/watch_out_software_engineers_chatgpt_is_now/[4] https://en.wi.bwl.uni-mainz.de/dominik-sobania/
-
2022-05-23 16:13:32
上海奉贤等区开展常态化防疫压力测试 有序开放公交、公园、公共服务场所、公共街区商区<
本报上海5月21日电 (记者刘士安、曹玲娟)上海正在奉贤等区开展常态化防疫压力测试。在21日召开的上海市疫情防控工作新闻发布会上,奉
-
2022-05-23 16:13:32
“抗疫 宅家云课堂”,吸引沪上老同志观看50万人次<
由上海市委老干部局主办,上海市老干部大学、市科技助老服务中心承办的“抗疫 宅家云课堂”系列直播讲座自4月12日启动以来,深受老同
-
2022-05-23 16:13:32
“代跑腿”买药、开通绿色通道 丰台为管控区居民提供便捷医疗服务<
“真是太感谢了,解决了我的燃眉之急!”家住假日万恒社区的杨女士对前来送药的居委会工作人员说。 自5月17日6时起,丰台区对青塔街...
-
2022-05-23 16:13:32
上海嘉定:儿童计划免疫接种全部恢复,实行预约制<
在5月22日召开的上海市新冠肺炎疫情防控新闻发布会上,嘉定区副区长王浩介绍,从4月28日开始,嘉定在防范区逐步有序恢复老年人疫苗接种
-
2022-05-23 16:13:32
乡村振兴看新疆 | 种下红樱桃 结出“致富果”<
央广网阿图什5月22日消息(记者 罗成 通讯员 杨林)乡村振兴靠产业,产业发展靠特色。新疆阿图什市阿扎克镇麦依村积极引导农民因地制
-
2023-02-03 16:23:09
世界简讯:ChatGPT修bug横扫全场,准确率达78%!网友:程序员要开心了
ChatGPT修bug横扫全场,准确率达78%!网友:程序员要开心了,微软,代码,程序员,应用程序,openai,chatgpt
-
2023-02-03 15:16:21
美国冬季风暴肆虐:上千航班取消 这地进入紧急状态|每日信息
美国冬季风暴肆虐:上千航班取消这地进入紧急状态,美国,得州,达拉斯,阿肯色州,航班取消,冬季风暴,极端天气
-
2023-02-03 13:20:17
名单公布!伦纳德和浓眉双双落选!哈登炮轰NBA:我没得到尊重
名单公布!伦纳德和浓眉双双落选!哈登炮轰NBA:我没得到尊重,浓眉,nba,霍勒迪,全明星,NBA,美国篮球,科怀·伦纳德,詹姆斯·哈登,奥林匹克运动会
-
2023-02-03 11:18:58
环球今热点:大和:重申众安在线(06060)“买入”评级 目标价升至35港元
大和将众安在线(06060)2023-24年盈测上调18%-107%。
-
2023-02-03 09:43:56
国产新车品鉴:丰田Hilux50周年特别版发布 生来为越野|环球快资讯
汽车现在已经越来越普及,基本上都快实现每家每户都有汽车了,那么汽车这么多的情况之下,我们在用车的过程当中肯定也就会遇到各
-
2023-02-03 07:51:42
国新办新闻发布会:2022年实际使用外资首超1.2万亿元_当前快看
再创历史新高(副题)人民日报北京2月2日电 (记者罗珊珊)国新办2日举行新闻发布会介绍2022年我国商务运行情况。据了解,我国引资规模再创历
-
2023-02-03 04:20:59
钒电池板块2月2日跌0.24%,钒钛股份领跌,主力资金净流出2.15亿元
2月2日钒电池板块较上一交易日下跌0 24%,钒钛股份领跌。当日上证指数报收于3285 67,上涨0 02%。深证成指报收于12131 2,下跌0 22%。钒电池板
-
2023-02-03 00:50:53
霍秀秀和解雨臣的小说_霍秀秀结局 报道
1、霍秀秀用手机放大软件发现了吴邪从张家古楼带来的西藏玉石的孔中刻有三只首尾相接的蝎子,并且对玉石很有研究。2、在吴邪假
-
2023-02-02 21:35:12
【透视】新民调:美国青年人国家自豪感最低,认为美国在海外不占据道德制高点
中国日报网2月2日电(党超峰)据美国国家广播公司(NBC)附属电视台WFLA-TV报道,美国咨询公司“晨间咨询”公布的一项新民调显示,美国Z世代(年
-
2023-02-02 19:05:34
卡塞雷斯战役
1936年9月4日,经过了大约1个月的战斗,在里森堡本土及其边境线上的敌军已基本肃清。此时,里森堡军部面临着一个选择:是继续扩张,以参战来支
-
2023-02-02 15:46:40
【快播报】南风盛行!广西大部雨雾弥漫能见度欠佳
偏南暖湿气流影响下,广西厚云覆盖,昼夜温差明显缩小,08时大部气温为14~18℃左右。预计未来三天依旧南风当家,全区大部仍以阴、雨天气为主
-
2023-02-02 12:51:34
中国男排留洋军团+1,还是顶级联赛,一条正确的道路,队伍在壮大
如果你是中国男排的球迷,今天的一个消息,或许对你来说是欣喜乃至振奋的。波兰男排联赛劲旅格但斯克俱乐部官方宣布,中国男排的张景胤加盟该
-
2023-02-02 10:48:31
线上剧本杀,是昙花一现,还是未来可期? 每日看点
原标题:摆脱空间束缚,但体验感不及线下,技术机制尚待完善线上剧本杀,是昙花一现,还是未来可期?在此前由于疫情影响难以到店玩剧本杀的一
-
2023-02-02 01:08:23
云杉大小蠹_关于云杉大小蠹简述-今日快看
1、云杉大小蠹,Dendroctonusmicans,鞘翅目小蠹科大小蠹属的一种昆虫。2、分布在奥地利、比利时、捷
-
2023-02-01 18:42:22
鞍山钢铁首套焦油渣离心分离装置顺利投产
近日,鞍山钢铁首套焦油渣离心分离装置在朝阳钢铁焦化厂顺利投产。投产后,该厂焦油渣日产出量减少3吨,焦油渣中焦油分离效率达90 4%,提高焦
-
2023-02-01 16:27:29
【环球速看料】江苏银行:2022年归母净利同比增29.45%至254.94亿元 不良贷款率降至0.94%
江苏银行发布2022年度业绩快报,2022年实现营业收入705 70亿元,同比增长10 66%;归属于上市公司股东的净利润254 94亿元,同比增长29 45%。
-
2023-02-01 14:45:36
许炎2022年四季度表现,富国核心科技12个月持有混合A基金季度跌幅11.1%-环球播资讯
截止2022年四季度末,基金经理许炎旗下共管理5只基金,本季度表现最佳的为富国核心科技12个月持有混合A(014611),季度净值跌11 1%。
-
2023-02-01 11:54:55
半个中国的人都来版纳看房了吗? 世界新消息
半个中国的人都来版纳看房了吗?
-
2023-02-01 09:37:18
春节到长白山度假区滑雪,游客提前一年预定酒店
春节假期刚过,一批发烧雪友已经迫不及待开始预订明年滑雪季酒店房间。今天记者从长白山万达度假区了解到,因为今年度假区滑雪游客暴增,导致
-
2023-02-01 06:03:55
多措并举服务春运 保障旅客出行平安(2023春运一线)-全球热头条
本报海口1月31日电(记者孙海天)2023年春节假期,海口接待游客近122万人次,同比增长26 2%;实现旅游收入15 77亿元,同比增长22 1%。面对春运
-
2023-01-31 23:03:44
头狼:黄金1913继续加仓多,涨到1926,多单五连胜
狼哥今天从来没有想过要空,就是坚信黄金一定会上来最终还是上来了,因为黄金的底线就是在1900一线,我们在1900直接多,同时1905以及1913,1918以及1
-
2023-01-31 19:08:37
2023厦门胡里山炮台元宵节活动(猜灯谜+制花灯+捏福兔+吃汤圆)
厦门胡里山炮台“福兔迎春到欢喜闹元宵”系列活动1、欢喜猜灯谜活动时间:2月5日09:00-16:30活动地点:独木成林区域活动规则:将猜中灯谜编号
-
2023-01-31 10:58:20
山东亿元以上续建交通重点项目陆续全面复工|当前通讯
□记者 常青 报道本报济南讯 记者从省交通运输厅获悉,根据省政府部署要求,自1月30日起,省交通运输厅对全省交通建设项目全面开展督导服务
-
2023-01-31 08:45:53
兆龙互连:融资净偿还69.74万元,融资余额3814.59万元(01-30)
2023年1月30日兆龙互连融资净偿还69 74万元,融资余额3814 59万元
-
2023-01-30 23:58:37
环球资讯:俄外交部:日本须牢记过去教训,东京很清楚军国主义政策的后果
【环球网报道】综合俄新社、塔斯社等多家俄媒报道,俄罗斯外交部1月30日称,俄方正密切关注日本与美国密切合作以加速加强自身军事力量的有关计
-
2023-01-30 18:54:45
全球快报:新纳入近80家企业!天津经开区发布最新生态环境监督执法正面清单
为持续推进包容审慎柔性执法、提高生态环境监督执法效率,近日,天津经开区更新调整《经开区生态环境监督执法正面清单》,新扩充符合纳入条件
-
2023-01-30 16:21:22
环球观点:何氏眼科2022年净利预降逾六成
1月30日晚间,何氏眼科(301103)披露了2022年业绩预告显示,报告期内,公司出现了业绩下滑的情况,归属净利润预降逾六成。财务数据显示,2022年
-
2023-01-30 13:49:11
猪粮比价进入过度下跌二级预警区间
中国网是国务院新闻办公室领导,中国外文出版发行事业局管理的国家重点新闻网站。本网通过10个语种11个文版,24小时对外发布信息,是中国进行
-
2023-01-30 10:56:09
当前快讯:得分忽如倾盆大雨!鹈鹕&雄鹿第三节狂刷88分
北京时间1月30日,NBA常规赛鹈鹕对阵雄鹿。
-
2023-01-30 08:03:02
聚焦:魅族申请无界汽车商标,也要进军新能源汽车?
近日,天眼查数据显示,珠海市魅族科技有限公司现已申请注册了2枚“无界汽车”商标,国际分类均为运输工具,当前商标状态为申请中。去年7月...
-
河钢股份董秘回复:公司一直严格按照证监会及交易所的相关规定履行信息披露义务
2022-12-30 09:12:58 -
借呗逾期28天影响征信吗
2022-12-30 00:38:36 -
河南少林寺门票日常免票政策|前沿热点
2022-12-29 19:05:32 -
张新成:以青春之我、奋斗之我书写光影华章-通讯
2022-12-29 17:33:48 -
今日看点:嘉祥新冠疫苗第四针在哪打?地址及电话一览表
2022-12-29 15:33:17 -
ETH-USDT:区间震荡,等待流动性回归-热点聚焦
2022-12-29 13:10:39 -
全球即时看!招商宏观:美国经济的韧性及对中国放开后的启示
2022-12-29 11:10:39