随着人工智能智能体从实验项目转向生产系统,企业技术领导者担心当前的基础设施无法应对即将到来的可扩展性需求。
根据分布式SQL数据库制造商蟑螂实验室公司(Cockroach Labs Inc.)首席执行官斯宾塞·金博尔(Spencer Kimball)的说法,他们的担忧有充分理由。该公司因高可用性和韧性而备受推崇。公司最近对1125名云架构师和技术高管的调查发现,所有受访者都预期AI工作负载在明年会增长,其中超过60%预测增长幅度将达到20%或更多。
业界的大部分注意力都集中在图形处理单元作为最大的AI瓶颈上,但金博尔表示,更大的问题是AI应用背后操作系统的脆弱性。"每次你点击这些按钮或访问应用程序编程接口时,最终都会访问后端操作数据库,"金博尔告诉SiliconANGLE。
这意味着智能体AI将使后端需求的增长速度远超企业已经习惯的增长模式。传统应用程序设计为适应人类节奏的使用周期,比如每隔几秒点击一次。相比之下,AI智能体持续运行,可以产生大量的请求量。
每秒5000次操作
"当Python脚本访问你的API时,你面对的不是每两秒一次操作,而是每秒5000次操作,"他说。
蟑螂实验室的报告显示,许多企业已经看到了临界点。83%的受访者预计他们的数据基础设施如果不进行重大升级,将在未来24个月内失效,34%认为临界点将在未来11个月内到来。
金博尔称智能体为即将到来的需求"海啸",这种需求由更高的交易量和自主系统的不可预测行为驱动。企业数据库历史上以"每10年增长10倍多一点"的可控速度扩展,但AI时代将显著压缩这一时间线。
"三年内,将有10倍增长,"他说。"五年内,可能会有100倍增长。"
报告还强调了停机的财务后果:98%的受访者表示一小时停机至少造成1万美元损失,近三分之二表示每小时成本超过10万美元。
金博尔说,智能体快速切换到替代供应商和厂商的能力可能会放大这些成本。他举例说,一个智能体检测到银行账户管理系统的减速,并提议将客户转移到竞争对手那里,自动处理转换过程。
"我可以在大约10分钟内转移你所有的账单支付。你想让我转移吗?"金博尔说。
报告还确定了故障可能首先出现的地方。虽然36%的人说云基础设施或服务提供商将是第一个故障点,但数据库层以30%排在第二位。
云不是万能药
金博尔表示,仅靠云弹性无法解决问题。即使工作负载在超大规模云服务商上运行,数据库和数据管理层的架构选择将决定系统是否能够处理持续的AI驱动负载。
"虽然云基础设施提供了原材料,但叠加在其上的数据架构决定了系统在AI规模下是成功还是失败,"报告指出。
报告发现,85%的受访者至少将其总信息技术预算的10%用于对数据基础设施产生重大需求的AI计划,24%的支出超过25%。然而,报告表明领导团队可能没有充分认识到紧迫性。
63%的受访者表示,高管低估了AI需求超越现有基础设施的速度。
金博尔说,这种脱节可能使组织对使用模式的突然变化准备不足,特别是当智能体工作负载增长到与人类产生的流量相匹敌时。
"智能体流量与人类流量相比还很小,"他说。"这就是为什么现在一切还没有崩溃的原因。"
企业正在采用多种扩展策略,约一半采用混合或动态扩展方法,26%专注于水平扩展,22%专注于垂直扩展。
金博尔说混合方法是务实的。"一次性将所有东西都转移到完全分布式基础设施是有风险的,"他说。"你要先学会走路,然后再跑步。"
蟑螂实验室正在定位自己以利用这些趋势。金博尔说,公司长期以来一直强调可靠性,但预期来自AI的扩展压力将成为数据库现代化决策更突出的驱动因素。
"这个时刻正需要我们10多年来一直在构建的差异化优势,"他说。
Q&A
Q1:AI智能体为什么会对企业基础设施造成这么大压力?
A:AI智能体与传统应用不同,它们持续运行并能产生大量请求。传统应用适应人类节奏的使用,比如每几秒点击一次,但当Python脚本访问API时,可能是每秒5000次操作,这种巨大的访问量会对后端数据库造成前所未有的压力。
Q2:未来几年AI工作负载增长预期有多大?
A:根据蟑螂实验室CEO金博尔的预测,三年内将有10倍增长,五年内可能会有100倍增长。这远超企业数据库历史上每10年增长10倍多一点的可控速度,时间线被显著压缩。
Q3:企业应该如何应对AI智能体带来的基础设施挑战?
A:企业正在采用多种扩展策略,约一半采用混合或动态扩展方法,26%专注于水平扩展,22%专注于垂直扩展。金博尔建议采用务实的混合方法,因为一次性转移到完全分布式基础设施风险较大,需要循序渐进。