月入几万的程序员,要被AI取代了?
声明:本文来自微信公众号“光锥智能”(ID:guangzhui-tech),作者:白鸽,编辑:王一粟,授权站长之家转载发布。
程序员创造的AI,最先替代的是程序员。
“大模型的编码能力,现在已经具备高阶程序员(月薪几万元)的水平了。”阿里云云原生应用平台负责人、通义灵码负责人丁宇对光锥智能说道。
事实上,AI代码工具并不是新生事物,早在上一波人工智能浪潮中就已经开始落地应用。
但此前,“AI代码产品原本只是辅助工具,现如今可执行复杂项目、长上下文本编辑,及独立做简单代码任务等。”商汤科技旗下AI代码产品小浣熊家族的技术负责人张涛对光锥智能说道。
从辅助到独立写代码,AI代码已经进化为一个工程级“协同”编码工具。
基于此,不仅有越来越多的企业开始通过AI代码工具来实现程序开发的降本增效,2025年之后,AI甚至有可能将取代中级程序员。
Meta创始人扎克伯格日前表示:“2025年,AI将达到中级软件工程师的编程水平。”Meta将在2025年开始实现中级软件工程师工作自动化,最终会将其应用程序所有编程工作外包给AI。
这并不是危言耸听,当前AI生成的代码在企业中的渗透率已经达到了一个惊人的水平。
如谷歌有超过25%的新代码是由人工智能生成;科大讯飞内部AI生成代码采纳率已从2023年10月份的30%,至2024年6月份涨到了52%,单元测试行覆盖率从30%提到50%。
AI编码赛道之所以成为大模型应用最火热的赛道之一,是因为“AI Coding(人工智能编程)是大模型应用落地中最高频刚需、最具确定性的场景,是经过PMF(产品市场匹配度)验证的领域。”丁宇如此对光锥智能说道。
也正因此,越来越多的企业开始布局AI编码赛道,领先的科技公司如微软、谷歌、AWS、阿里、百度等走在前列。但如此多同类型产品,却也造成了同质化的竞争,未来该如何成功突围?如何实现真正的大规模地商业化落地?
从打辅助到协同作战,
AI真成了你的程序员同事
2024年8月,美国知名企业Cloudflare副总裁Ricky Robinett的女儿,一个仅8岁小女孩,用时45分钟就开发了一款聊天机器人,引发180万网友在线关注。
她使用的AI代码编辑器Cursor,也一夜爆火。这也让AI编码赛道再次成为行业关注的焦点。
在全球范围内,据 PitchBook 数据显示,大约有250家初创公司推出了 AI 编码助手。在国内,包括阿里巴巴、百度、腾讯、字节跳动等互联网大厂,科大讯飞、商汤科技等独角兽企业,甚至AI大模型创业公司智谱AI等都纷纷推出相关产品。
AI代码产品如雨后春笋般露出,是大模型给AI代码工具能力带来实质性的进化。
早期AI代码工具主要能够执行简单任务,比如根据程序员的注释,自动补全代码,在程序员写代码过程中,提供代码错误提示等。
随着大模型能力的升级,AI代码工具能够解决的问题越来越多,比如能够基于存量工程进行维护升级工作,“已经能够自主实现某些研发任务了。”丁宇说道。
比如,大语言模型能够以自然语言理解人类指令,并根据工程上下文,自动完成复杂编码任务,包括同时修改前后端多个文件,执行脚本、编写测试、部署代码等。
“最开始通义灵码是以编码助手的形态出现,主要是给程序员打辅助,根据代码上下文,帮助程序员在研发时自动补全代码。”丁宇说道,“2024年年底通义灵码升级到2.0的AI程序员形态,成为协同编码助手,能够和人类程序员协同工作,感知整个工程,根据场景任务做批量文件修改,实现能力的跃迁。”
而从AI代码工具助手升级为AI程序员,前者代码生成的主力还是人,而后者则逐渐转向以AI为主,人类在其中主要起到监测和确认的作用。
“此前主要是由人写代码,AI辅助做一些简单的、可预测性强的、重复性的工作,而现在则可以通过需求描述,让AI来理解和帮助程序员完成一些中等难度的代码开发工作。”张涛也如此说道。
另外,随着多模态大模型、深度推理大模型的进化,AI代码工具的能力也在不断完善。
商汤小浣熊家族的“办公小浣熊”产品,除了可以进行基于大模型的数据处理、数据分析和文档创作外,还能够支持生成数据图片和 PPT文件,这是一个多模态能力输出的综合体现。
多模态输入同样重要,“很多工具类产品,如果仅通过语言描述来交互,很难准确地实现需求,因为当我们把内容描述成文本时,存在语言表达上的信息损失。同时,大模型当前自身存在的语义理解能力上的欠缺,幻觉问题等,也限制了AI代码工具的能力边界。直接以图像或视频等视觉方式输入至大模型,则能够更高效地完成任务。”张涛说道。
同时,多模态大模型能够让AI代码工具实现从文生图,到生代码的端到端全栈功能的实现。
以网站设计为例,设计师可以通过文生图的方式设计出前端视觉稿之后,可以直接给到Coding大模型,把视觉稿翻译成前端界面,再根据前端界面功能大模型自动生成后端代码。
“目前,AI编码已经可以完成复杂任务,消除知识技能的不对称,比如从前端到后端可以一体化生成,打破了以前前端、后端人员和能力的分离协作模式,大幅提效。”丁宇说道,“并且在生成之后,AI编码还可以帮助程序员自动生成测试,最终返回测试修改好的结果。”
不过,虽说AI已经能够自主生成一些代码,但在实际过程中,AI所生成的代码并不能够一次性运行起来,其中也存在着诸多bug。
一位浙江大学AI方向在读博士生陈荣(化名)对光锥智能表示:“复杂点的代码都会有Bug,基本上很难一遍过,从技术逻辑上来说,可以理解为模型其实把coding当作翻译任务一样来做,输出的是一串代码序列,可能没考虑好代码的运行环境等。”
这背后的原因主要有两方面,一方面是大多数人类很难准确地描述出自己的实际需求,甚至很多资深程序员在写代码过程中也是需要反复修改。
另一方面,则在于大模型当前自身理解语义能力上的欠缺,包括存在的幻觉问题,也限制了AI代码工具的能力边界。因此,虽然“在模型上下文窗口允许的范围,大模型可达到万行级代码的理解,但AI代码的能力边界仍然较难界定。”张涛如此说道。
就像人类程序员需要反复修改测试代码一样,在AI生成代码过程中,也可以通过与其多轮交互,来减少代码bug的存在。
丁宇表示:“AI编码并不是一次性生成最终结果,而是跟大模型有多轮交互迭代完成,在跟大模型联合编码过程中,有持续思考和推理探索的过程,在多轮交互修改结果正确后,还可以自主进行测试验证,并对代码进行部署使用,全生命周期完成任务。”
尽管当前AI代码工具产品仍存在一些问题,但有越来越多的企业开始引入AI代码类工具,“便宜活儿好”的AI代码工具不仅提高了程序员的编程效率,也实现了企业的降本增效。
大型项目中的“螺丝钉”,
AI为程序员提效超10%
大模型给AI代码工具带来的进化,让编程的门槛变得更低。
目前,AI能够独立实现自主编程的场景主要有三类:
一类是小产品,比如个人生活类的APP助手;
一类是以内容为主的网站,其代码量和难度适中,AI能够自主实现;
一类是办公产品,比如Excel表格编辑、数据汇总等。
从实际应用来看,这些场景整体的代码量并不高,且实际开发难度并不大,对于开发者的编程知识要求也不高。
可以说,AI代码工具确实降低了编程的门槛,让更多无代码能力的人能够接触到代码编程,并可以自主开发一些产品功能。
但是,尽管AI代码工具降低了编程的门槛,却需要程序员提升自身编程能力的上限,尤其是在更加复杂的软件开发以及大型企业级系统软件开发中。
一位金融科技行业的程序员肖肖(化名)对光锥智能表示:“对于一个公司的工程化项目,还是很难直接全盘交给AI,工程化项目要求的流程多,也需要多部门协作,而AI没办法看到全局。”
可以明显看到,在企业中大模型做的更多地还是脏活累活,全局性及创新的活儿还是需要人类程序员来做。
“程序员的工作并不仅仅只是生成一个小型项目,其面对的生产代码,整个项目文件上下文非常复杂,代码关系也很繁杂,而程序员也对代码质量有自己的要求。”张涛说道。
这也就意味着,于企业中的程序员而言,AI代码工具更多还是辅助性角色,但也间接地拉高了程序员工作能力的下限,毕竟简单重复性的工作,AI基本已经能够搞定。
“如果让AI直接生成一家银行所有业务的10万个代码文件,它目前肯定是做不到的。”丁宇坦言,“目前在企业大型项目中,AI编码肯定是从小任务开始,找到一个切面,如实现一个功能模块,或者在一个百万工程代码中找安全漏洞,AI能够做得非常准确且快速。”
另外,业内皆知,对于大型企业项目来说,最怕存在的问题就是系统的不确定性,如果出现系统bug,就可能会带来资源和经济上的巨额损失。
因此,在丁宇看来:“大型工程仍需要人类程序员来掌握软件开发过程中的不确定性,比如架构设计、领域建模等,把已经确定性的内容拆解开来,比如模块开发、找安全漏洞、补充测试用例等,并交付给AI,让其根据人类的指令做这些确定性的工作。”
尽管只是打辅助,AI代码工具却也给开发者和企业带来了实打实的效率提升。
以阿里云为例,目前所有技术全员都在使用通义灵码,月活占比超82%,每天AI生成的代码占总提交代码量30%以上。基于这个数据大致能够算出来,AI对开发者提升效率大概是17.5%,打个折扣也会在10%-15%之间。
“因此,我每次见企业的负责人都会讲通义灵码能够给工程师团队提效10%以上。”丁宇说道,“也就是说,如果一家企业有100个工程师在使用通义灵码,就能额外产出10个工程师的产能。”
另外,人类程序员都是有细分分类的,比如前端、后端等,如果想要让一个后端去做前端,那可能就需要给后端工程师做大量的培训学习,其并不能立马就接手前端程序员的工作。
但有了AI代码工具后,程序员只需要问问AI,就可以轻松学习各种语言平台的研发知识,快速上手。“以前做一个项目可能花两三周预研,现在两三天就能完成任务,让员工实现1-N的能力增长。”丁宇说道。
当然,对于AI来说,还可以帮助人类程序员做更多重复性的工作,比如很多开发者都不愿意写测试代码,这些在程序员角度来看属于没有创造性的工作,但却又不得不做。
而AI代码工具可以根据程序员的代码作为提示词,自动生成单元测试,真正地解放了开发者,让开发者把精力花在更具有创造性的工作上。
此外,对于企业来说,除显性价值提升外,存在的隐性价值在于,AI代码工具能够让企业更容易保持软件系统的高质量且长期稳定,其不仅能够做单元测试的补全,还能够自主发现安全漏洞并给出修复建议,提升质量的同时,还能缩短项目交付周期。
更为有趣的是,现阶段AI的编码能力,借助外部工具使用,已经逐渐赶超中级程序员,商汤小浣熊底层模型特点之一,就是在代码解释器能力上做了加强,让模型能够实现自主代码调试迭代。
“在复杂项目中,单纯依靠大模型推理生成代码,一次性通过率不高,一般不超过20%。”张涛说道,“而办公小浣熊基于代码解释器方案,在日常图表等能力上,代码通过率已经接近80%。”
AI编码赛道开始分化,
细化场景的创新决定成败
AI编码已经是一个通过PMF验证的落地方向,这也导致众多玩家切入这一赛道,出现众多同质化类型的产品。
目前,在中国市场中众多企业,包括互联网大厂、中小企业,及大模型创业公司,都纷纷推出了AI代码产品,比如阿里云的通义灵码、百度的文心快码、字节跳动的豆包 MarsCode、腾讯云AI代码助手、智谱AI的CodeGeeX等等。
尽管AI代码产品众多,但各家在提供的功能能力上差别并不是很大,“目前市场中同质化比较严重,功能实际上差不多,毕竟编程产品希望能够解决用户的问题是一样的。”张涛说道。
不过,随着大模型技术的迭代升级,AI编码赛道也迈入了“分化”的中期阶段。“从当前AI代码赛道来讲,已经开始分化出不同的实现方式。”张涛说道。
像Cursor这样的产品,能够基于自己改造的开源IDE,做完整的任务编程;也有像Bolt.new这样的产品,以线上工具的形式使用,用户描述需求,AI完成网页开发,但它只能实现前端技术栈相关内容等。
现阶段可以明显看到,各个产品已经开始找到不同的细分场景并构建自己的产品优势,实现差异化发展——有的更擅长做网页开发,有的则更擅长做已有项目的一些代码修改任务,还有的可以做一些小工具的开发,或低代码工作等。
丁宇也认为:“软件研发存在非常多场景,有很多细分领域,企业可以从不同的切入点切入,做细分场景的创新或产品形态的创新。”
而各家AI代码工具产品在功能场景上的细分,也会给各家产品带来商业上的差异,不同企业的商业化侧重点也并不完全相同。
比如商汤科技小浣熊家族中办公小浣熊产品主要聚焦在办公工具类赛道,在实际的商业化落地中,则是C端和B端同步进行。
其中C端主要以付费订阅为主,B端以企业进行私有化部署为主,“目前私有化部署客户接近40家,包含体量比较大的互联网厂商等。”
不过,张涛同样看好C端赛道的市场潜力,现阶段C端产品的推广超预期。
从场景功能,到商业化落地方向,AI编码赛道都已经开始出现分化,但这并不是AI代码行业发展的终局形态。
随着大模型技术能力的持续迭代,下一步AI代码将实现“自主编程”,即不仅仅辅助程序员开发项目,而是能够自主接受独立的需求,完成完整的项目任务。
“未来一定会走向AI 自主编程,这也意味着将为企业和开发者带来10倍的IT生产力提升。”丁宇说道。