财经新闻网消息:
他们推出了一款名为 Devin 的人工智能 (AI) 助手,可以协助人类软件工程师完成许多开发任务。 Devin 与其他现有的 AI 程序员不同。 它可以从头开始搭建网站、自行部署应用、修复bug、学习新技术等,人类只需扮演发出指令和监督的角色。
这是第一位真正完全自主的人工智能软件工程师。 它一亮相就引起了轩然大波,因为人们担心:人类程序员真的要失业吗?
在测试中超越“同行”
据官网介绍,Devin 只需一条命令即可端到端处理整个开发项目。
根据用户需求,Devin可以同时执行多步骤工作流程,人类工程师可以实时观察其进度。 当发现错误时,将发出指示予以纠正。 这使得工程师可以将大部分工作“外包”给人工智能,同时他们可以专注于创造性工作。
在SWE-bench基准测试中,Devin的表现远优于2、Llama、GPT-4等选手,能够完整正确地处理13.86%的问题。 相比之下,GPT-4只能处理1.74%的问题。 更重要的是,Devin 在测试中没有得到任何帮助,而所有其他模型都需要帮助,即人们准确地告诉模型哪些文件需要编辑。
这一进展标志着人工智能自主理解和解决软件开发问题的能力取得了重大进步。 目前,Devin已经顺利通过了一家AI公司的面试,并完成了互联网上的实际工作。
几乎完全自主运行
Devin 的伟大之处在于它可以规划和执行极其复杂的工程任务,这些任务通常需要数千个决策才能完成。 在此过程中,无论采取哪一步,它都可以回调所有相关的上下文信息,以保证任务的逻辑性并方便随时纠正。
更令人震惊的是,Devin不仅可以帮助人们解决代码,还涵盖了与之相关的整个工作流程。
例如,当工程师需要设计一款网页游戏时,Devin可以先生成网页,然后完成服务器端部署,最后直接发布到网上,省去了中间大量的手动操作。 即使发现漏洞后,Devin也会回溯错误报告的位置和相应的数据,然后分析原因并提供解决方案。
此外,作为AI全能助手,Devin还可以帮助人类训练和微调其他AI。 对于一些常见的模型,你只需要提及模型的名称,Devin就会知道如何训练它。
那么人们需要做什么呢? 预计最终的德文将允许人类只能发号施令,而不能做其他事情。
对软件开发行业有着深远的影响
这家初创公司虽然只有十名员工,但手中握有十枚IOI(国际信息学奥林匹克)金牌,核心创始团队是三名中国人。
Devin目前处于内测阶段,感兴趣的用户可以申请提前试用。 目前,团队尚未透露更多核心技术细节,但他们表示,Devin 源于其长期推理和规划研究的进展。 编码只是第一步,这个AI助手其实还可以扩展到更广阔的领域。
Devin的出现可能会对软件开发行业产生深远的影响,甚至可能减少对人类开发人员的需求。 但值得注意的是,该技术仍处于早期阶段,其成熟度和有效性有待业界进一步评估。
目前来看,Devin 的成功可以说为当今的软件开发者带来了更新更好的 AI 协作体验。 人们从繁琐的工作中“解放”出来,只需要监督AI系统来处理即可,同时可以将精力投入到创新任务上,实现生产力的真正提升。
免责声明 ① 本网所刊登文章均来自网络转载;文章观点不代表本网立场,其真实性由作者或稿源方负责 ② 如果您对稿件和图片等有版权及其他争议,请及时与我们联系,我们将核实情况后进行相关删除 ③ 联系邮箱:215858170@qq.com