企业将业务迁移到云端需要添加集中监控功能
在企业的云迁移清单中,几个重要步骤可以确保实现云中运营的业务价值和应用程序的可靠性。其中一个关键步骤是为云计算的基础设施建立整体监控策略,其中包括网络、安全性、计算和存储以及应用程序、数据库和服务。添加监控功能可提供意外问题的早期警告,这对于管理容量、成本、长期可靠性至关重要。
不同的云迁移策略以不同的方式推动业务敏捷性,但投资于监控(特别是应用程序监控)是云迁移清单中列出的这些方案的首要任务:
监控云计算应用程序和服务可能需要新工具
不幸的是,添加新的监控功能可能并不容易。对于开始采用云计算的组织来说,需要考虑一整套新的监控工具和警报类型。已经投资和运营数据中心的组织可能会发现,用于虚拟化系统和私有云的内部部署工具可能无法用于公共云应用程序、服务以及无服务器计算。即使组织采用多云策略,他们也可能希望利用每个云计算供应商的内置监控功能。这实质上意味着任何云迁移都可能引入新的监控工具。
云迁移的另一个因素是,新用户通常需要参与配置监控工具和响应警报。例如,新的云原生应用程序可能有开发人员、DevOps工程师和业务所有者的参与,他们是关于监控什么和发生事件时应该向谁发出警报的主题专家。最重要的是,即使有很好的理由将监控添加到云迁移清单中,也会增加复杂性。当集中监控策略作为云迁移或多云策略的一部分执行时,这可以实现最小化。
实施集中监控策略
通过查看过去如何部署和配置监控工具,企业可以更好地了解集中监控解决方案的需求和功能。大多数IT运营团队都从一些基本的监控工具或平台开始报告网络和基础设施。这就是运营团队应该在响应基础设施问题方面更强大的原因,但在应对最终用户、应用程序或数据库性能问题时历来表现不佳。
除基础设施监控工具外,运营团队更常见的是根据需要添加监控工具。在某些情况下,添加工具是为了响应一系列重复出现的问题,例如,监视不可靠的数据库是否存在容量和性能问题。在其他情况下,监控与添加新的基础设施(如新的数据中心位置、网络、企业系统或存储设备)紧密相连。添加云计算基础设施属于第二类。
在添加新的监控工具时,分配给工程师的工程师通常会配置该工具以设置报告和警报,以便直接发送给其团队。这可能是快速配置报告和警报的最简单方法,但从长远来看,它创建了对信息的孤立访问,以及多个团队从不同工具接收警报的可能性。
更好的方法是集中监控。每个监控解决方案都会收集数据,并具有对诊断问题有用的专有报告。但这些相同的监视数据随后被聚合到一个集中的监视程序中,该监视程序随后可以在更广泛的数据范围内集中执行许多功能。这种集中化有几个好处:
首先通过集中数据和与工作流工具的集成来实现智能化。当组织实施自主操作,并利用开放式机器学习将警报智能分组为可管理的事件时,真正的好处成为现实。
云迁移是实施集中监控的最佳时机
创建集中式监控解决方案的理想时机是将应用程序和服务迁移到云端。企业仍然必须在基础设施、应用程序和服务级别完成配置监控的过程。但是,企业没有在这些解决方案中配置升级,而是采取步骤将监控数据和警报集成到中央系统中。这将使工作从在单个监控工具中实现升级转移到了集中化的工具中。最后,IT运营团队可以轻松获得集中化带来的所有好处。
但这也取决于实施集中监控所采取的方法,并且有几种策略。实现专有的数据湖和报告工具可能提供最大的灵活性,但它确实需要在开发数据湖或数据仓库、构建报告、配置警报以及与工作流工具集成方面进行投资。
集中监控功能非常强大,尤其是当机器学习正确地将多个警报关联到单个事件时,可以更快、更轻松地识别根本原因。这就是在核对清单中包含云迁移中的集中监控的原因。它通过提供更丰富的监控措施来平衡添加基础设施新功能的风险,而且它可以比在多个监控工具中配置警报更有效地实现。