中国存储网消息,Cloudflare三个周内的第二次重大宕机,再次引发了人们对互联网底层基础设施韧性的担忧,支付专家和IT领导者警告称,服务中断现在应被视为常规运营风险,而非罕见事件。

这家内容分发和安全公司遇到了新的技术问题,影响了访问包括一些人工智能工具和电子商务平台在内的多种网站和在线服务。虽然具体范围和持续时间仍在评估中,商家和企业正准备应对因交易失败和服务中断而导致的数周后续工作。
支付风险公司Chargebacks911和数字员工体验公司Nexthink表示,此次事件凸显了企业在流量路由和基于人工智能的工具上对少数技术提供商的依赖程度。
商业影响
“Cloudflare,这家为全球众多最受欢迎网站提供服务的互联网服务提供商,在三周内第二次宕机。截至撰写本文时,停机仍在持续,因此我们尚不清楚问题的严重程度,但无论是持续几分钟还是几小时,都会影响全球各地的公司。
这些中断不仅拖延了互联网用户的处理,还扰乱了正在进行的购买,给商家带来了漫长的混乱和行政负担。他们可能在几周后还在理清今天停机引发的争议——事实上,一些公司很可能仍在应对上次停机带来的反弹。
目前,公司需要将此类中断视为常规运营风险,而非偶发异常。及时跟踪失败和重复交易。在客户开始猜测问题出在之前,先联系他们,并保持详细的事件记录,避免几个月后被拒付时还要重建事件。
这不是恐慌的问题。而是面对停电正成为现实常态的现实。Cloudflare今天又宕机了,但下周可能会有另一家服务商出现问题。唯一的问题是企业是否会适应这种模式,还是继续交叉手指,希望运气能填补空白,“Chargebacks911和Fi911创始人兼首席执行官Monica Eaton说。
信用卡支付争议(信用卡退款)通常发生在客户在账单上看到陌生或重复的交易,或他们认为自己被收取了未送达的商品或服务费用时。结账或付款授权期间系统中断可能会增加此类争议的数量,因为商家和发行机构在事件期间只能依赖不完整的日志或发送给客户的混乱信息。
伊顿表示,商户的运营重点应是实时监控失败和重复支付,并维护清晰的事件记录,以便在客户日后提出交易质疑时可参考。
人工智能依赖
这次停机还影响了依赖Cloudflare服务的一些AI工具。这引发了企业如何管理依赖外部AI平台进行日常运营和知识工作的风险问题。
Nexthink去中心化战略副总裁蒂姆·弗劳尔斯表示,此次事件应促使组织重新评估人工智能在其工作流程和恢复规划中的核心地位。
“我们常说,'人工智能全天候工作,不休息',但我们一次又一次地看到,它绝对可以进行非计划的休息,且没有任何复工时间。这给组织带来了一个令人不安的现实。随着他们越来越深入人工智能,工作流程和核心功能开始依赖模型和助手,而曾经帮助快速恢复的人类知识也在不断缩小。运营和机构专业知识已被人工智能驱动的工具所取代。大多数时候这没问题,直到AI出现故障。一旦发生这种情况,企业就会陷入死胡同。
如果人工智能要成为每个应用和工作流程的核心,那么我们就需要开始像核心IT基础设施一样重视人工智能依赖。这不仅仅是一次颠覆,更是未来十年IT韧性需要准备的警示信号,“Nexthink去中心化策略副总裁蒂姆·弗劳尔斯说。
云和人工智能服务通常以软件订阅形式采购,但弗劳尔斯认为,这些服务现在对许多企业来说更接近电力或网络连接。故障可能会暂停围绕AI助手重新设计的软件开发、客户支持和内部决策流程。
接连发生的Cloudflare事件很可能会引发对厂商集中和故障切换安排的重新审视。一些在线零售商和服务提供商通过多个内容分发和DNS提供商路由流量,但也有些依赖单一供应商。
风险与支付团队还需审查他们的事件手册,包括停机期间如何与客户沟通,以及系统恢复后如何核对日志。接受大量无卡支付的商户在授权与确认之间交易中断时,尤其容易出现错误。