用天文望远镜,观测云原生

“2019年是云原生理念和技术普及的元年;
2020年是云原生的全面应用之年;
未来,云原生将成为新常态。”
正如我们无法给出让所有人都满意的“云原生”定义,我们同样无法判断这种说法的正误。但毫无疑问的是,云原生是近几年云计算领域最炙手可热的话题。
从“上云”到“云上”,云原生重塑世界
云计算作为信息产业的全新业态,对社会与经济发展起着重要的促进与推动作用。近年来,国家相继颁布了一系列云计算相关法规与标准,从引导企业上云到推动云上业务应用创新,云计算的技术演变不断加深人们对云原生的价值认知。十年前,软件足以“吞噬”世界;十年间,开源社区、云计算与云原生相继出现,技术在重塑人们价值认知的同时,也在重塑IT运行的规则,重塑世界。
从2008年到2020年,“上云”是大势所趋。意识到云作为可弹性扩缩的基础设施资源后,企业纷纷将业务应用从传统环境迁移至私有云、公有云与混合云环境。
自2013年首次提出“云原生”概念开始,云原生的理念与技术被不断丰富、普及与应用。2015年云原生计算基金委员会(以下简称“CNCF”)的成立,更是建立了云原生技术生态体系,“云上”重塑IT应用、架构等成为潮流。据Gartner预测,到2025年,云原生平台将成为95%以上新数字倡议的基础。
摒弃将传统的IT架构与应用“迁移上云”,将应用的开发方式、架构、部署与维护全部建立在云上,可以最大程度发挥云计算弹性扩缩、动态调整、自动伸缩等技术价值,帮助企业最快地应对市场变化,拥有颠覆传统业务的能力。具体来说:
- 云原生大幅降低企业的IT开发与运维成本
- 云原生提升企业业务创新效率与产业价值
随着云计算技术的不断发展,传统的IT基础设施被云端资产所取代,云原生成为新的生产力工具在承载海量业务的同时,提升企业的创新效率,创造新的产业价值。云原生区别于早期的虚拟机等,在应用特性与交付架构上进行了重塑,将应用程序代码解耦成独立模块化单元,在实现快速弹性扩容的同时,带来更易拓展的应用。此外,云原生技术的易用性与开放性,从一开始就与开源生态携手,通过不断壮大的应用实例,拓展云原生技术的生态体系,塑造云原生产业生态。
云原生的快速发展,为运维监控带来挑战
上文提到过,云原生时代,应用(业务)是核心。《CNCF Cloud Native Definition 1.0》中提到云原生技术有利于各组织在公有云、私有云和混合云等新型动态环境中,构建和运行可弹性扩展的应用。当应用真正建构与运行在云原生环境后,运维部门却时常会遇到监控系统显示正常,业务部门反馈“业务系统崩溃”的情况;亦或运维人员已经看到监控系统发出告警,监控系统却无法精准定位故障节点与故障根因。而这些问题背后,总与云原生应用技术有着千丝万缕的关系。
- 首先,云原生环境,基础设施发生变化:
- 其次,云原生环境,应用架构发生变化:
- 再次,云原生环境下应用的生命周期发生变化
- 规模化的微服务部署对分布式系统要求进一步提升,其动态性与敏捷性造成监控数据收集成本的大幅增加;
- 容器化造成监控节点成倍扩大,海量的监控数据对数据处理分析能力以及故障快速定位能力提出更高要求;
- 云原生环境存在大量、可拓展的集群,集群、组件与节点间需要实时、快速、可视化的关联分析与逻辑访问关系梳理能力。
-
···

(传统监控能力VS可观测性能力)[1]
我们一再强调,云原生提供的解决方案,是系统不可变基础设施。服务网格(Service mesh)、边车(Sidecar)、服务编排和容器之类的新兴架构模式可以有效地阻止基于云的世界中出现的各类错误实践。
云原生时代,运维须具备可观测性能力
—— Baron SchSchwarz
如果将监控比作显微镜,可观测性能力更像是天文望远镜,它的机体构成更为复杂,从研发到运维,每个团队都需要具备可观测性理念。
主流的可观测性能力基于Logging、Tracing、Metrics三类数据构建:
- Logging即日志信息,记录处理的离散事件。它展现的是应用运行而产生的信息或者程序在执行任务过程中产生信息,可以详细解释系统的运行状态。此外,日志的存储与查询都会消耗大量的资源;
- Tracing即处理请求范围内的信息,可以绑定到系统中单个事务对象的生命周期的任何数据。由于面向请求,Tracing可以轻松分析出请求中的异常,但同样会消耗资源;
- Metrics即可聚合性数据,为一段时间内可度量的数据指标,透过其可以观察系统的状态与趋势,存储空间较小。

(Metrics、Tracing、Logging三者间的关系示意图)[2]
与云计算发展同频,
天旦保障云原生业务可观测、可扩展
近日,在北美“KubeCon + CloudNativeCon”峰会上,CNCF宣布天旦(Netis)正式成为CNCF会员,并入选CNCF Landscape 全景图,成为可观测性和分析(Observability and Analysis)领域的推荐厂商。

(CNCF Landscape全景图-可观测性与分析推荐厂商)
在云计算技术演进的过程中,天旦逐渐加快性能管理技术的研究脚步,从“迁移上云”时代到“保障云原生应用”时代,为众多用户提供业务可观测性与可扩展性保障。如今,我们将这些行业案例与技术实践集结成册,推出《天旦混合云监控规划指南2021》,助力更多用户迎接云原生时代的来临。
参考文献:
[1] 选自《Monitoring in the time of Cloud Native》
[2] 选自Peter Bourgon,Metrics, tracing, and logging,2017
关注天旦公众号
跟旦旦一起,
让运维稳定无忧,
运营做你所想。

