IT之家 2 月 3 日报道称,人工智能正在对软件开发方式产生颠覆性影响。目前,许多困难和琐碎的编程任务是由代理和子代理组执行的。然而,开发人员正在不断探索新的人机协作交互界面和产品格式。即使是最好的人工智能实验室也难以跟上这种迭代的步伐。据IT之家介绍,当前的趋势是开发智能软件或系统,让人工智能代理能够独立完成编码任务。 Claude Code 和 Cowork 等应用程序就是这种模式的典型示例。与此同时,OpenAI也在逐步完善其Codex工具。该工具于去年 4 月作为命令行工具发布,一个月后扩展到 intweb 界面。现在,OpenAI 正式迈出了迎头赶上的重要一步。当地时间周一,该公司推出了专为 macOS 系统量身定制的新 Codex 应用程序ems,集成了过去一年中广泛应用的不同类型的智能开发逻辑。这个新应用程序支持并行多代理操作,并将不同代理的功能与下一代工作流程集成。该版本是在 OpenAI 宣布其最强大的大规模编码模型 GPT-5.2-Codex 后不到两个月发布的,该公司希望该模型能够吸引 Claude Code 用户。 “GPT-5.2是目前处理复杂场景下高精度开发工作最强大的模型。然而,之前的使用门槛相对较高,因此我们相信将这一模型的强大能力封装在一个便捷的接口中具有重大价值。使之更加灵活。”OpenAI首席执行官Sam Altman在与媒体的电话会议中表示。尽管 Altman 对 GPT-5.2 充满信心,但各种编码基准测试的结果却显示出复杂的趋势。截至撰写本文时,GPT-5.2 在 TerminalBen 中排名第一ch,一项衡量人工智能处理命令行编程任务能力的测试。然而,Gemini 3 和 Claude Opus 的代理得分基本相同(尽管略低),并且在基准的误差范围内。 SWE Bench 是另一个测试人工智能修复真实软件漏洞能力的基准测试,也返回了类似的结果。 GPT-5.2并没有明显的优势。然而,智能应用场景很难用现有的基准和差异进行有效评估。在用户体验方面,最好的模型可能会很棒。此 Codex 应用程序还附带了许多新功能,使其与各种 Claude 应用程序相当,在某些情况下甚至超越了各种 Claude 应用程序。该应用程序支持设置自动任务,可以根据预先设定的计划在后台自动运行。执行结果存储在队列中,用户返回后可以统一查看。用户还可以选择不同根据座席的工作风格,座席有不同的交互风格。它可以从实用的沟通类型转变为同理心的沟通类型。但对于OpenAI来说,产品的主要卖点是人工智能提供的最大开发效率。 “仅使用这个工具,你就可以从头开始,在几个小时内开发出相当复杂的软件,”他或 Altman 说。 “唯一的限制是新想法的融入速度以及软件的开发速度。”
特别提示:以上内容(包括图片、视频,如有)由自有媒体平台“网易账号”用户上传发布。本平台仅提供信息存储服务。
请注意:以上内容(包括图片和视频,如有)由网易号用户上传发布至社交媒体平台,网易号仅提供信息存储服务。