|
|
马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。
您需要 登录 才可以下载或查看,没有账号?注册
×
作者:微信文章
AI 驱动运维的 7 项不可妥协要素
核心要点:企业必须确保 AI 和自动化能够带来可衡量的投资回报和运营价值,确保部署是为了实际影响而非表面形式
2025 年 12 月 2 日 上午 5:00 作者:Cristina Dias
当前提供无缝、全天候数字体验的压力前所未有,但数字运维团队和预算往往难以跟上这一现实。随着数字运维变得更加复杂,事件需要在几分钟而非几小时内解决,企业为何需要 AI 和自动化来支持当今现实世界运维的原因比以往任何时候都更加清晰。
这些技术现在构成了现代 AI 驱动运维和事件响应的支柱,能够缩短平均修复时间(MTTR)、减少停机时间并增强弹性。IDC 预测,到 2025 年底,67% 的企业 AI 投资将来自将 AI 嵌入核心运维。然而,仅靠投入是不够的。企业必须确保 AI 和自动化能够带来可衡量的投资回报和运营价值,确保部署是为了实际影响而非表面形式。
AI 和自动化评估卡片的 7 项不可妥协要素
为评估 AI 和自动化投资的真实价值,企业必须努力实现 AI 驱动运维的这七项不可妥协要素:
1. 真正的端到端事件管理
当事件发生时,团队无法承受在断开连接的工具之间切换或丢失上下文。孤立的系统会导致延迟、混乱和额外成本。跨业务功能拥有不同的工单系统、ChatOps 工具、流程和实践会使事件管理变得混乱。
企业需要一个统一的 AI 和自动化层,支持从检测到持续学习和预防的完整事件生命周期。这一层消除了零散集成的需求,即 AI 或自动化仅处理部分环节或需要大量集成才能有效工作。
2. 内置自动化
自动化应该是嵌入式的,而不是附加的。需要持续人工干预或仅处理单个步骤的实施会增加复杂性而非效率。自动化应与现有工作流程协同工作,而不是与之对抗。
原生自动化跨团队、工具和时区进行编排,使自动化民主化,让每个人都有安全的工作流程访问权限。适当的控制也很重要,以确保投资能够在企业范围内安全扩展。例如,瑞安航空公司在其事件管理生命周期中自动化了超过 25,000 个日常任务,通过对已知事件的嵌入式自动修复,每年节省了 1,000 多个人工时。
3. 运维级 AI
为了有效的事件管理,AI 必须理解 IT 运维,而不仅仅是分析数据。该技术应能够检测模式、做出实时决策并精确触发警报。它应充当 IT 基础设施的数字孪生,减轻人工响应者的压力,使他们能够专注于更高价值的任务。
要达到这一点,AI 必须在真实运维数据上进行训练,并设置防护措施以确保可靠性和集成。没有上下文的华丽 AI 在压力下会失败;运维级 AI 每次都能提供可用的见解。
4. 可操作的事后审查
事件应推动学习,而不仅仅是修复。如果事后审查不能提供可操作的见解,那么企业注定会重蹈覆辙。应避免手动报告流程和断开的文档,因为它们会减缓进展。审查必须与行动和结果相关联。
企业需要由 AI 驱动的审查,包括生成式 AI 驱动的叙事能力。这些 AI 驱动的审查将事件转化为可操作的讨论和有意义的经验教训。例如,Zendesk 自动化了事后审查,将分析时间缩短了 80%,并提高了事后分析的参与度和参与率。
5. 连接的生态系统
最好的事件管理平台不要求 IT 团队改变工作方式,而是完全适应他们的现状。企业需要能够实现敏捷性并减少摩擦的 AI 和自动化。毕竟,如果工具迫使您适应它们,那么它们不会帮助您的数字运维团队,反而会阻碍他们。团队需要能够与已在使用的应用程序无缝集成的 AI 和自动化计划,无论是用于可观测性、工单管理还是协作。
6. 易用性
如果 AI 或自动化难以使用,那么它不会为事件管理工作流程增加价值。事件响应需要从第一天起就产生价值,而不是几个月或几年后。易用性意味着 AI 和自动化不会带来繁重的实施、僵化的设置以及为跟上步伐而不断进行的重新设计。以 Specsavers 为例:在不到一年的时间里,它将其自动化扩展到 2,000 家门店的超过 120,000 次执行,节省了 225 天的手动工作时间,并将服务分析师入职时间减少了 75%。
7. 经过验证的可靠性
当发生 SEV 1 或 SEV 2 事件时,响应团队需要不会增加混乱的 AI 和自动化。可靠性是不可妥协的。IT 运维要求 AI 和自动化具有高可用性和零计划外停机时间。没有什么比在关键业务时间内出现意外中断、维护停机时间或时好时坏的运行时间更快地破坏事件响应了。企业必须拥有在压力下表现良好的 AI 和自动化。
规模化构建弹性
要规模化构建弹性运维,企业必须根据这七项原则对 AI 和自动化工具进行压力测试。需要数月才能显示价值、缺乏可靠性保证或具有高总拥有成本的部署表明脆弱性,应予以避免。这同样适用于任何具有单点故障(如聊天应用依赖)且没有冗余的实施,或需要多个附加组件才能运行的实施。通过选择在压力下表现良好的技术,企业可以标准化 AI 和自动化,做出更快、更明智的决策,并将事件管理转化为竞争优势。
文档来源:The 7 Non-Negotiables of AI-Driven Operations
原始作者:Cristina Dias
原始发布日期:2025 年 12 月 2 日
本文由 AI 助手整理优化,欢迎关注、分享转载,请注明出处
|
|