混合云的监控和可见性
如今的混合架构需要结合使用监控技术来创建现代的、全栈、混合云监控功能。
现在许多企业已经开始了他们的云迁移之旅,大多数企业都采用混合云架构来跨不同的内部部署和公共云基础架构部署应用程序。通过最大限度地节省成本和提高工作效率,同时解决隐私和安全问题,这种内部部署和云计算资源的结合使用可以作为过渡但舒适的中间立场。
虽然这些是实施数字化转型的明智之举,但它们引入了新的运营领域,这些领域需要结合使用监控技术来创建现代化的全栈混合云监控功能。
无论企业如何选择构建其混合云部署,都会引入两个新的运营领域:第一,公共数据中心的基础架构和架构不再受企业控制,第二,跨越多个网络的复杂服务间通信矩阵分布式应用程序组件和数据中心之间。任何一个部分的不稳定性和中断都会产生影响最终用户体验的雪崩效应。
对于内部部署数据中心(混合云最熟悉的方面),企业拥有数据中心内的所有内容,从应用程序到基础设施和网络。监控技术的组合在这种环境中表现良好。但是,在数据中心之外,企业没有基础设施,其传统的监控技术已经达到极限。
应用程序可用性和性能指标(如页面加载和响应时间)通过合成技术测量:
" APM(应用程序性能管理)通过代码注入和基于代理的数据收集提供最终用户体验的视角。
" 基础设施监控的范围从捕获健康指标到SNMP轮询,再到使用基于Unix的实用程序(如collectd)来读取网络设备的性能数据。
" 数据包捕获和流记录提供了对流量进入和流出数据中心的组合理解。
监控云计算在公共云环境中,企业可能拥有IaaS提供程序中托管的应用程序,但企业无法控制基础设施或网络方案。基于虚拟主机的数据包捕获探测(如ntop或虚拟分路器)是选项,但它们会增加大量开销。VPC日志和类似CloudWatch的服务对于了解VPC实例的性能指标至关重要,并且在大多数情况下需要与Datadog或Splunk等现代分析平台集成。
大多数混合型企业依靠互联网(由多个ISP组成)作为其本地数据中心和公共云之间的底层连接引擎。但是,当这些互联网服务供应商(ISP)成为连接方程式的一部分时,在中断期间,企业需要能够隔离哪个提供商的网络导致问题,并且有足够的证据让他们做出响应并解决问题。
如果没有这种级别的可见性,企业将离开所有必须在平台之间以及暴露于高度系统性风险的微服务之间完美执行的API调用,而无需有效的方法来检测和修复问题。幸运的是,可以结合使用主动监控技术来获取应用、网络路径和BGP路由层洞察。
这就引出了一个问题:全栈混合云监控功能是什么样的?在混合云计算环境中,完整堆栈监控不再仅仅是在孤岛中查看网络、服务器、存储和应用程序代码的垂直方法。这仍然有效,但企业还需要一个横跨不同类型数据中心的水平镜头,包括它们与运行在该连接上的众多服务间通信线程之间的连接。
企业应考虑技术和数据集的组合,以构建跨所有三个运营领域的数字服务交付的综合视图。最终,所有这些数据应该集成在一个或多个基于数据的大型自动化和算法友好的平台中,使运营团队更智能、更快捷。