自愈网络——无需人工干预即可自动检测、诊断和修复网络问题的系统——有望在未来实现近乎零停机时间、自动故障恢复以及更具韧性的数字基础设施。然而,尽管自愈网络拥有诸多优势,它远非即插即用的解决方案。探索这项技术的公司应该花时间了解其复杂性、投资以及文化转变,才能真正实现这一目标。
下文,国外专家为正在评估自愈网络的企业分享了他们的重要建议。他们的见解不仅强调了如何充分释放该技术的潜力,还指出了在大规模实施和管理这些系统时应避免哪些陷阱。
1. 重新思考并定义网络架构
虽然可能需要深入的技术解释,但实际上,这项演习的最大价值在于公司必须从头开始重新思考和定义其网络解决方案的架构。通过这项演习,公司可以发现降低业务风险、提升服务质量和效率的机会。自我修复只是演习结束后的一个方面。——Agur Jõgi,Pipedrive
2.采用基于AES的加密
随着网络向自主和自愈方向发展,基于AES的加密已不再是可有可无的,而是不可或缺的。缺乏强大加密的自修复系统,一旦恢复,就有可能陷入受损状态。AES凭借其久经考验的强度和效率,确保了其韧性与真正值得信赖的基础设施所需的安全性相匹配。——Srinivas Shekar,Pantherun Technologies
3.提前投资监控和自动化
需要注意的是,自愈网络虽然可以减少停机时间,但需要在智能监控和自动化工具方面进行前期投资。好处是什么?长期来看,可以节省成本,减少中断次数,加快恢复速度——但前提是网络从一开始就设计有精确的遥测和自适应响应规则。——Sanjoy Sarkar,第一公民银行
4.建立成熟的基础设施和明确的政策
自愈网络可以延长正常运行时间并减少人工干预,但成功的关键在于拥有成熟的基础设施和明确的策略。如果没有适当的配置,自动响应可能会失效。企业必须在设置、监控和治理方面进行投资,才能真正受益于自愈网络的弹性和自动化。——Hemanth Volikatla,SAP America Inc.
5.充分认识到实现完全自动驾驶仍需数年时间
一个完全自愈的网络,能够检测、诊断并修复网络问题,无需任何人工干预,仍需数年时间才能实现。但低代码/无代码自动化平台和人工智能将使这些流程更快、更轻松,并逐步实现自愈。确保这些人工智能和自动化工具能够访问实时网络数据——这将使一切更加准确。——Song Pang,NetBrain Technologies
6.确保适当的设计和治理
企业在考虑自愈网络时应该了解的一点是,虽然自愈网络能够显著减少停机时间并实现故障恢复自动化,但它需要谨慎的初始设置、持续的监控和强大的安全策略。如果没有合理的设计和治理,自动响应可能会无意中加剧问题或造成安全漏洞。——Bhupendra Singh,万豪国际
7.优先考虑可见性
自我修复网络不仅能解决问题,还能隐藏问题。这很强大,但风险也很大。诚然,您可以减少停机时间,但如果您停止监控根本原因,小问题就会悄然演变成结构性问题。投资可视性要与投资自动化一样多,否则您将在自动驾驶仪的引导下盲目飞行。——Oleg Sadikov,DeviQA
8.利用持续学习
自愈网络擅长执行已知问题的策略,但其真正的优势在于持续学习。企业必须明白,这不是一个“设定好就忘”的系统——持续的强化学习才是适应新故障并不断提升系统智能的关键。——Kiran Patibandla
9.从干净的数据和清晰的计划开始
自愈网络听起来像魔法,但真正的力量在于如何构建它。它们不仅能解决问题,还能解放你的团队,让他们专注于重要的事情。但这需要的不仅仅是技术。你需要干净的数据、智能的自动化和清晰的计划。能够正确运用这些技术的领导者不仅能避免宕机,还能构建一个更智能、更平静的未来。——Aditya Vikram Kashyap,摩根士丹利
10.注重可观察性和明确的故障转移规则
自愈网络对于减少停机时间非常有效,但问题在于:它们非常复杂。您需要一流的可观察性和清晰的故障转移规则,因为错误的设置可能会引发连锁故障。但如果您做得正确,您将看到弹性的大幅提升,并且得益于快速、自动化的修复,运营成本也会下降。——Rohit Ayyagari,SunRun
11.确保拥有必要的基础设施和专业知识
企业应该了解的一件重要事情是,虽然自愈网络可以提高正常运行时间并减少人工干预,但初始实施可能非常复杂且耗费资源。企业必须确保拥有必要的基础设施和专业知识,以确保正确集成,因为设置阶段可能需要大量的时间和投资。——Sandeep Telu,Infosys Consulting
12.通过适当的配置和零信任原则降低风险
自愈网络并非即插即用的解决方案——它需要严谨的IT流程、可视性和网络安全协调。虽然它可以减少停机时间并实现自动恢复,但如果缺乏适当的配置和零信任原则,它可能会掩盖更深层次的漏洞,而不是修复它们。——Scott Alldridge,IP服务
13.评估外部依赖性
自修复网络能够提供更高的弹性、稳定性和服务一致性,但也会带来额外的实施成本。企业应评估其对外部供应商的依赖关系,并通过制定稳健的SLO、SLI和SLA来管理这些依赖关系的潜在影响。任何依赖该网络的关键业务服务都应能够满足预期目标,才能充分利用自修复网络的优势。——Abhi Shimpi
14.考虑技能差距
企业应该考虑技能差距带来的挑战。自愈网络可以减少停机时间,但许多公司缺乏具备AI技能的员工来管理这些停机时间。诺基亚为AT&T的5G部署提供的培训为我们指明了方向。提升团队技能以增强韧性,确保AI驱动的网络不会超越专业知识。——Durga Krishnamoorthy,Cognizant Technology Solutions
15.投资清洁遥测、安全自动化和身份识别执行
自愈网络不仅仅是修复故障,它们还能帮助人们更好地判断。如果这种逻辑存在缺陷,你很快就会自动化故障。首先要投资于干净的遥测、安全的自动化和身份感知的执行。了解常见问题仍然至关重要。自愈能力固然重要,但只有与可见性、可审计性和控制措施(了解触发事件的人员和原因)相结合,才能发挥其作用。——Dan Sorensen
16.纳入清晰的身份和访问治理
自愈网络可以增强安全性,但如果缺乏明确的身份和访问治理,则存在自动化错误操作的风险。集成知识图谱和数字孪生技术,使组织能够模拟身份关系和访问路径。这确保纠正措施能够感知上下文,并且不会干扰合法访问。——Craig Davies,Gathid
17.建立根本原因记录
从我在实际系统中的观察来看,自愈网络听起来很理想,但如果设计不透明,可能会掩盖更深层次的问题。它们不应该只是默默地解决问题,而应该清晰地记录根本原因。长期的韧性来自于学习,而不仅仅是恢复。——Gopinath Kathiresan,苹果公司
18.做好应对工程师工作量影响的准备
审计系统会增加维护工程师的工作量。虽然整体工作量最终可能会节省时间和金钱,但这并非一个可以“设置后就忘掉”的系统。了解检测、修补和修复的流程以及最终结果至关重要。自动化系统往往在没有适当的人工监督的情况下偏离轨道。——WaiJe Coler,InfoTracer
19.更新KPI
在投资之前,请考虑您的企业如何衡量成功。自愈网络将重点从响应转向预测,因此关键绩效指标(KPI)必须不断发展。“事件计数”等传统指标可能会下降,而现在的价值在于“预防故障”。如果不重新定义绩效指标,您可能会误判进展。——Roman Vinogradov,Improvado
20.预防重于修复
预防胜于修复。投资自愈基础设施不仅关乎危机管理,更关乎持续的性能、抗压力和长期的系统可靠性。架构良好的自愈网络很少发生灾难性故障。它是更广泛战略中的重要一环,而这一战略依赖于智能设计和幕后人员的辛勤付出。——Trisha Swift,Mula Integrative Health & Wellness
推荐站内搜索:最好用的开发软件、免费开源系统、渗透测试工具云盘下载、最新渗透测试资料、最新黑客工具下载……
还没有评论,来说两句吧...