竞技宝app官方

光能和热能简介 MIT微柔为AI量身打造了一套leetcode编程题

发布日期:2021-07-09 08:15    点击次数:129

 

本文经AI新媒体量子位(公多号ID:QbitAI)授权转载,转载请有关出处。

你见过这栽编程题现在描述手段吗?

MIT微柔为AI量身打造了一套leetcode编程题

不必自然说话描述,也异国输入输出示例,你所望到的就只有一个Python函数。

这是来自MIT、Allen AI和微柔的钻研人员挑出的一栽崭新的编程题现在描述手段:

每个题现在都由一个简短的Python函数f定义,现在标是找到一个输入x,使f输出true。

云云的题现在形态能够让AI审题更容易,人类程序员的理解也不会受到影响。

AI编程,道路真是越来越平了啊。

接下来就来详细望望这个钻研吧。

MIT微柔为AI量身打造了一套leetcode编程题 异国自然说话描述的编程题现在

再来注释一下这栽描述手段:光能和热能简介

题现在采用Python函数的形态,参数为应案。

解题的现在标是找到使函数输出为真的输入x,即已足f(x)= true的切确应案。

现在请你举一逆三:求解一个有1000个不赓续“o”的字符串,用这栽新形态如何描述呢?

MIT微柔为AI量身打造了一套leetcode编程题

切确应案:

MIT微柔为AI量身打造了一套leetcode编程题

下面是另外两道题现在标描述示例。

动态规划—最长单调递添子序列题目:

MIT微柔为AI量身打造了一套leetcode编程题

经典的汉诺塔 (Towers of Hanoi ):

MIT微柔为AI量身打造了一套leetcode编程题

钻研人员按此栽出题形态囊括了各栽编程题,挑出来一个开源数据集:叫做P3。

该数据集题型专门周详:涉及差别难度、差别周围和差别算法工具等方面的题现在光能和热能简介。

有浅易的字符串操作题目;

有经典如汉诺塔和国际象棋(例如,骑士游历算法和N皇后题目变体)等难题;

也有两人挑衅追求最佳策略的题型,如井字棋(Tic-Tac-Toe)、石头剪刀布、珠玑妙算Mastermind等;

还包括来自国际数学奥林匹克竞赛(IMO)和国际大门生程序设计竞赛(ICPC)的题现在,如各栽图论和数论难题。

MIT微柔为AI量身打造了一套leetcode编程题

统统包含208栽题型、14万+的题现在,并且还在赓续更新中。

每个题现在都挑供了起码一栽应案。

MIT微柔为AI量身打造了一套leetcode编程题

这套稀奇的编程挑衅题库数据集,抓住了编程题现在标内心,可用于教AI编程并评估AI的编程能力。

钻研人员外示,这套题能够对AI的编程能力进走客不都雅评估。由于不必查望应案,就能直接验证解应的切确性。所以,这栽题现在不会增补AI学习任何应案过失的义务。

期待这个数据集能够开发出新的AI编程解决方案

差别AI求解器按照这些题现在编程的成绩如何呢?光能和热能简介

钻研人员做了一些深入的实验,开发了基于随机森林、Transformer和差别类型GPT-3 prompts的AI求解器,它们采用差别参数枚举、自顶向下的手段,行使这个P3数据集来评估性能。

最先,测试这些求解器在这个数据集上行使此前解决题现在标手段来解决新题现在标自举效率(bootstrapping efficacy)。

终局发现,增补尝试次数能够解决新题现在。但它们也能经过学习以前的经验,更快地解决新的难题。

下图为这些AI求解器在差别尝试次数下的已解决题现在数目:

MIT微柔为AI量身打造了一套leetcode编程题

而在一项幼的用户钻研中,21名在Python编程方面有差别经验年限的程序员完善了差别难度的30个题现在。每个题现在最多分配6分钟的时间来解决。

用这个数据集评估AI与人类程序员对编程题难度的感知发现:

人类觉得难的题对AI来说也更难,现阶段情况下,AI求解器能解决的大无数题都是对人类来说比较浅易的。

MIT微柔为AI量身打造了一套leetcode编程题

上图外示人类和AI对各栽题现在标难度打分,按人类分数排序。人类的难度分数经过超出批准的最大解题时间的平平分数来衡量,AI的则是按照解题所需的尝试次数。

另外,AI用这栽形态的题现在能够解决了60% 的难题,初学者和有经验的程序员平均别离解决了 76% 和 87% 的难题。

总的来说,行使这个稀奇的数据集,经过精心设计的AI求解器,能够大大缩短AI编程求解所需的尝试次数、并解出更多的题现在。

所以,钻研人员期待,这个新的编程题库数据集能声援行家钻研和开发新的AI编程解决方案,挑高AI编程的效率和性能。

此前,UC伯克利曾训练AI刷LeetCode,统统5000道题的测试中,AI能做出15%。

不清新行使这个数据集训练,AI编程的能力又会达到什么程度呢?

论文地址:https://arxiv.org/abs/2106.05784

开源数据集链接:https://github.com/microsoft/PythonProgrammingPuzzles

【编辑选举】光能和热能简介

同事问吾,SQL 语句显明命中了索引,为什么实走很慢? JavaScript 异步编程指南 — 解决方案 Async/Await 抓包就清新CoreDNS域名解析 用AI指挥另一个AI,GAN+CLIP的组相符成了“CG艺术家” 把毛选和鲁迅全集喂给AI后,写出来的高考作文太对味了