科技行業(yè)的大趨勢 | 2025年4月:人工智能與企業(yè)變革篇
由Willian Amaral(https://www.thoughtworks.com/profiles/w/willian-amaral)和**Mike Mason**(https://www.thoughtworks.com/profiles/leaders/mike-mason)所著
最新一期的技术雷达刚刚出炉了,伴随着这一期的发布,我们对宏观趋势有了更深入的洞察,这指导了我们在雷达会议中的讨论,同时还有来自更广阔技术领域的观察。我们的首席AI官,同时也是这个系列之前作者的Mike Mason,抽出时间再次作为共同作者参与其中。他将与现任技术雷达产品负责人的Will Amaral搭档,提供一些超出当前雷达版本的额外见解。
AI的热度依然不减,所谓的“氛围编码”成为了新的潮流围绕人工智能的热情依然高涨,新的AI功能和应用场景似乎每周都会宣布。我们之前提到,与AI相关的工具正以指数级的速度增长,既包括日常使用的工具,也包括常规的软件工程。在过去六到十二个月里,现代工具现在不仅可以处理复杂的代码重构,理解整个代码库,还可以执行命令。在上一期的雷达中,我们注意到出现了“代理型”编码助手,这一趋势至今依然在快速发展中。例如,Cursor,Cline和Windsurf等早期产品在将这些功能集成到IDE方面处于领先地位。已有数十家公司承诺提供“代理型”的软件开发解决方案。
虽然这一切听起来很有前景,但值得注意的是,这些工具是以监督的方式运作的——人类开发者仍然“在循环中”,引导AI并批准其行动。最近的一个例子是“氛围编码”——一种轻松的工作方式,开发人员可以通过语音或聊天提示随意地指导AI。这个概念因它的速度和随意性而显得很有吸引力,特别是适合快速完成的项目。然而,这个术语迅速走红起来,一些公司和初创企业声称他们完全采用“氛围编码”来编写关键的生产代码。这引发了关于负责任使用AI的讨论和反思,强调了开发人员判断力和彻底的代码审查在AI辅助开发中的重要性。我们对软件开发者被AI完全取代的说法持怀疑态度,认为这并不现实:我们自己实验中,Claude Code 在第一次尝试时为我们节省了97%的工作量,但在接下来的两次尝试中却表现不尽如人意。
企业智能:企业AI化AI 正在逐步渗透到企业的运营中——它不仅仅是一个自动化任务的工具,而是能够从根本上改变组织的决策制定、风险管理以及与客户互动的方式。我们还没有完全达到那个程度,转型仍然不完全。但越来越多的公司开始看到未来的轮廓,在这样的未来里,AI 不仅仅是在业务之上的一个附加层,而是嵌入到业务的核心。
这引发了重要的问题:不是AI是否会成为基础设施,而是我们如何为此做好准备,而不是手忙脚乱。
随着这一转变的发生,质量保证和监管变得越来越复杂和紧迫。传统的质量保证做法并不具备处理这些情况的能力。因此,工程团队已经开始使用模型可观测工具、评估框架和专门针对AI的测试实践——特别是在错误代价极高的行业中。
其中一个新兴的挑战是所谓的“AI作为影子IT”。各个团队自行搭建自己的工具——有时是开源的,有时是SaaS——而没有通过正式渠道。不难理解为什么会出现这种情况:这些工具易于操作且功能强大,而且通常可以解决实际问题。但它们也带来了风险——形成了一个监管不足、缺乏一致性的AI使用的碎片化局面。一些企业已经开始通过建立轻量级注册表、使用监控和灵活的政策框架来应对这一问题。这还处于早期阶段,但已经开始采取措施,意图很明显:在不失去治理的情况下推动创新。
还有另一个更大的、较少被讨论的变化正在发生:人工智能也开始在组织设计上产生了影响。这不仅仅是关于更快地完成更多的任务,更重要的是,它在改变谁来干什么,如何做决策,以及责任归属。角色界限变得模糊。关于信任和权威的假设正在被考验。这不仅仅是技术层面的问题——它还涉及到领导、人事和治理。大多数公司还没有准备好应对这一变化的深度。
在团队层面,人工智能促使开发人员和设计师停下来思考:我们是为人类而建,还是为机器而建?随着AI工具变得越来越好——代码生成、设计建议、自动化——很容易落入追求速度的陷阱。但有些团队正在抵制这种趋势,重新重视产品思维和用户体验,确保我们所建造的东西仍然有意义和可持续性。人工智能可以加快交付速度,但不应该以清晰度或关怀为代价。
企业的“AI化”并非一场滔天巨浪,而更像是一种悄然上涨的潮水——悄无声息,持续,悄悄地塑造着周围的一切。适应良好的组织不仅会采用新工具,还会提出更深层次的问题——关于结构、能力和信任,并利用这些问题的答案来有意图地引导自身的发展。
可观测性让复杂性变得易于管理现代软件系统高度分布,并且越来越多地包含AI组件,这使得可观察性变得比任何时候都更加重要且更具挑战性。本期雷达着重介绍了一波可观察性领域的创新浪潮,旨在应对这种复杂情况。首先,随着可观察性变得越来越重要,许多急需的标准也开始获得牵引力。我们看到了OpenTelemetry采用率的大幅提升;它现在是CNCF增长最快的一个项目之一,得到了来自超过200个组织的支持。它促成了一个中立的生态系统,并且得益于诸如Alloy、Tempo和Loki等工具的支持——为开发者提供了一系列的选择和灵活性。
另一个推动可观测性的动力当然是AI。AI和LLM的可观测性因其独特的挑战而受到特别关注。仅靠跟踪指标和日志无法检测到模型漂移、提示失败和幻觉。为此,新兴的平台如Arize Phoenix,Helicone和Humanloop应运而生,用来追踪和评估LLM的调用。这些工具记录提示,跟踪模型响应,帮助诊断质量相关的问题。随着团队开始运营AI,这种可见性对于建立信任和可靠性至关重要,就像APM(应用程序性能监控)对于微服务一样重要。
AI对可观测性的影响也是相互的,这种影响体现在将AI辅助集成到可观测性工具自身中。由于云应用中遥测数据(日志、指标、跟踪)量巨大,操作人员越来越依赖AI来更快地检测异常并定位问题。主要监控平台现在都嵌入了机器学习功能,用于异常检测、警报关联和根本原因分析,比如Weights & Biases的“Weave”。
超越AI的焦点很容易就被人工智能(AI)的热潮所吸引——每周都有新的头条、突破或大胆预测。但在所谓的“传统”软件开发领域中,一些最有意义的进步正在发生。人工智能仍然没有解决我们日常遇到的一些主要问题之一——跨平台框架中存在的顽固问题。这就是为什么我们可以看到一些熟悉的工具正在悄悄但有力地进化。
以命令行接口(CLI)为例。即使随着图形用户界面(GUI)、基于聊天的工具以及自动化的普遍兴起,命令行工具不仅没有消失,反而越来越受欢迎。开发人员继续使用它们,因为它们速度快、控制力强、透明度高,而且使用方便。而且随着现代工具如 uv 和 MarkItDown 的出现,我们看到了新一代的命令行工具,这些工具既高端又简单,让人感到舒适。这证明命令行不仅没有被淘汰,反而在适应新的环境,保持其重要性。
我们还看到了一些有趣的编程语言变化。新兴语言如Gleam正开始获得一定的影响力,而像Swift这样的语言则在原先的生态系统之外进一步扩展其影响范围。Swift尤其在资源受限的环境中开始崭露头角——在这些环境中,性能、可靠性和内存安全变得尤为重要。这提醒我们,开发者正在积极寻找能够兼顾现代安全特性和实际效率的工具。
在变化的环境中,保持稳固的基础虽然人工智能在新闻和工具中大放异彩——从代码助手到运营平台——其普及却重新强调了基础方面:数据质量和可靠系统。如果没有高质量的数据,即使是性能最强的人工智能模型也会表现不佳。说到底,软件的核心还是在于如何将数据存储、处理并转化为价值。
在我们的对话中,一个持续的主题浮现:组织和研究人员正在重新考虑他们管理、服务和检索数据的方式。检索增强生成(RAG)技术正在迅速发展,因为有效的检索是通用型模型与组织特定智能之间的桥梁。一个具有过时或不相关上下文的大模型往往不如一个拥有及时和高质量数据的小模型有用。当前的前沿研究包括提高相关性、可追溯性及可解释性,以使RAG更加可靠透明。
但如果底层数据得不到妥善处理,这些进步就没有太大意义了。扩展人工智能和数据分析需要一个稳定的数据基础。越来越多的团队不再将数据视为后台附属品,而是将其视为一个高质量的产品——有明确的所有权、质量标准,以及良好的文档支持,并注重易用性。这种“数据产品思维”借鉴了诸如“数据网状结构”等概念,在这种结构中,领域团队负责管理可被发现且易于互操作的数据资产。
实践中,数据产品可能是一个客户360数据集、一个风险评分系统,或者一个内部仪表板——这些都像任何软件产品一样被设计、版本更新和支持。它拥有客户,提供价值,并随着时间发展。
信息很明确:拥抱新事物,但别忘了根基。软件的下一个时代不会仅仅靠人工智能来打造——它将由那些既有人类创造力又有机器智能,且具备严格工程纪律的团队来推动。这才是真正的关键所在。
共同學習,寫下你的評論
評論加載中...
作者其他優(yōu)質(zhì)文章