网易首页 > 网易号 > 正文 申请入驻

微服务洞察,让微服务更透明

0
分享至

来 源 | 阿里云云原生团队

微服务作为云原生时代下一种开发软件的架构和组织方法,通过将明确定义的功能分成更小的服务,并让每个服务独立迭代,增加了应用程序的灵活性,允许开发者根据需要更轻松地更改部分应用程序。同时每个微服务可以由单独的团队进行管理,使用适当的语言编写,并根据需要进行独立扩缩容。但微服务同样也并非“银弹”,在带来如此多的优势的同时,逐渐膨胀的微服务数量也为系统带来了空前的复杂度,服务之间错综复杂的调用、协作关系如同一层迷雾笼罩在系统之上,借助 Trace、Log、Metric 三驾马车我们的系统具备了一定的可观测性,但所能得到信息是标准化且固定的,往往不能够满足复杂场景下的观测需求,比如微服务引擎 MSE(Microservices Engine)中的微服务治理功能模块为用户用好微服务提供了诸多帮助,但其中的很多功能,比如全链路灰度、无损上下线等会涉及多个应用,且所涉及的信息又不被标准的可观测系统覆盖。而微服务洞察通过动态的信息采集能够填补这其中的一部分空缺,更好地满足这些微服务场景的观测需求,同时也将他们纳入到标准的观测体系中来。

微服务洞察

设想这样一个问题现场,线上系统出现了一个奇怪的问题,某一个接口偶现错误,频率不高,出现时间毫无规律,但是没有发现任何有效的错误日志。这时,在通常的实践中,除非具备脑内 debug 的神力,不然我们往往需要在代码中增加日志逻辑,然后重启应用,静静等待问题复现后查询日志,如果定位了问题范围需要更多的信息,就需要我们不断循环 编写日志逻辑->重启应用->静静等待 的步骤直到解决 bug。但这还不是最令人头疼的,如果给这个问题加上问题触发伴随应用重启、pod 内日志丢失、重启后问题无法复现等 debuff,排查的难度将会进一步上升。

而由于微服务洞察具备任意位置类粒度的动态信息采集的核心能力,能够帮助我们解决上述场景中的一些痛点。首先在第一次发现这个问题后,我们可以直接在线上环境中通过配置一条微服务洞察的规则,来收集一些初步信息来帮助我们判断可能的问题原因。由于收集的信息会以调用链的形式组织,我们可以从中获取问题出现的频率、时间、参数分布、上下游调用信息等。同时由于信息会直接上报并集中存储到远端系统,因此不受应用重启的影响,我们也不需要一台一台实例去查询日志。

在对问题有了初步的判断之后,我们往往能够将问题定位到一个范围之内,这时我们可以进一步锁定某些方法,通过配置规则,打印它们的入参、返回值、调用堆栈等信息来判断其执行是否符合预期。

通过上述的举例可以发现,借助微服务洞察的能力,我们能够轻松地探知标准的可观测系统难以触达的角落,从而满足我们对一些微服务场景的观测需求。

洞察微服务场景

无损下线

无损下线是微服务治理中的一个功能,主要是为了解决在发布过程中的微服务在下线的过程中可能存在的流量损失。其大致流程如下图所示。

通过一系列的策略和措施,能够做到服务的完全无损下线。但这样就导致无损下线的流程比较复杂,同时还涉及到多个节点之间的通知机制,特别是在大规模之下,下线流程的完整性以及可靠性的确认变得非常复杂与繁琐。这就是前文所提到的难以触达的角落,我们可以通过微服务洞察的能力帮助我们观测这个场景。

针对无损下线的场景,微服务洞察提供了场景化的规则,简单配置一键开启。

在开启了规则之后,微服务洞察会收集无损下线流程中值得关心的信息,组织成调用链的形式展示。如下图场景,我们对 108 节点进行缩容操作,我们就可以得到一条 Tracing 链路,其中包含主动通知、服务注销、应用停止等几个步骤,并且我们可以在每个步骤中看到所需的信息。

在主动通知环节我们可以看到当前 Provider 节点对哪些 Consumer 进行 GoAway 请求的调用,如下图所示我们将主动通知 10.0.0.90、10.0.0.176 两个 Consumer 节点。

当 Consumer 收到 GoAway 调用后,会进行负载均衡列表的刷新以及路由的隔离,我们将在负载均衡地址列表中显示最新抓到的当前 Consumer 对于当前服务缓存的最新地址列表,我们可以在下图中看到,地址列表中只剩下 10.0.0.204 这个服务提供者节点的调用地址。

我们也可以看到 Spring Cloud 向 Nacos(注册中心)执行服务下线的调用结果,注销成功。

微服务洞察通过将无损下线的 workflow 抽象成 Tracing 结构的策略,可以帮助我们降低大规模场景、复杂链路下无损下线问题的排查成本。

全链路灰度

全链路灰度是微服务治理中的另一个功能。有时某个功能发版依赖多个服务同时升级上线,我们希望可以对这些服务的新版本同时进行小流量灰度验证,这就是微服务架构中特有的全链路灰度场景,通过构建从网关到整个后端服务的环境隔离来对多个不同版本的服务进行灰度验证。在发布过程中,我们只需部署服务的灰度版本,流量在调用链路上流转时,由流经的网关、各个中间件以及各个微服务来识别灰度流量,并动态转发至对应服务的灰度版本。如下图:

而在使用该能力的时候,要想探清流量的匹配情况以及流量的走向具有较大的难度。而借助微服务洞察的能力可以帮助我们便捷地感知这些信息。

这部分的示例将基于 A、B、C 三个应用,其中 A、B 应用分别部署一个基线版本和一个灰度版本,其内部存在 /a -> /b -> /c 的调用链路。

我们只需要配置如下的规则可以看到流量的路径,以及实例和流量的标签信息。

从所展示的信息中可以看到,灰度流量正确地流经了灰度实例而不是非灰度实例(其中 mse.app.tag 是应用的标签,mse.tag 是流量的标签)

全链路灰度支持按照 headers 中的信息来匹配灰度流量,因此我们也在上一条规则的基础上,增加如下的规则来观测灰度流量的 headers 信息,来帮助我们判断流量匹配是否符合预期。

开启规则后,对于 /a -> /b -> /c 链路中的带有 gray 全链路灰度标签的流量,会在采集上一条规则所定义的信息的基础上,同时采集 Headers 信息,在链路展示页面详情展示如下:

借助微服务洞察的能力,我们只需要简单的规则配置,就可以完成对复杂的全链路灰度场景的观测,让我们在使用全链路灰度时不再提心吊胆。

引用的框架/组件内部

微服务架构下的开发往往会使用很多框架或是中间件,这些框架和中间件的内部无法添加日志逻辑,因此在使用时对开发者来说时黑盒的,极大地增加了观测的难度。而借助微服务洞察,任意位置都只需要通过配置规则的方式就可以获取到现场信息。接下来以负载均衡和 Nacos 为例。

Nacos

Nacos 借用官网的描述,致力于帮助您发现、配置和管理微服务。Nacos 提供了一组简单易用的特性集,帮助您快速实现动态服务发现、服务配置、服务元数据及流量管理。处于微服务架构中的关键位置,但是目前在可观测方面 Nacos 服务端能够获取一些信息,但是客户端则成了黑暗的角落,开发者也不能随意地添加日志信息,想要关注其中的信息难上加难。而在微服务洞察的帮助下,通过简单的规则配置,就可以获取到客户端内部的信息,来补全这部分的观测需求。

我们以服务变更回调的方法以及收取订阅服务内容的方法为例,前者会在所订阅的服务发生变更时被触发,后者会在收到订阅的服务内容时被触发,通过关注这两个方法的入参,我们便可以获取到此时服务的详细信息。

负载均衡

以 Spring Cloud 常用的客户端负载均衡组件 Ribbon 作为示例,Ribbon 位于客户端一侧,通过服务注册中心(本文中为 Nacos)获取到一份服务端提供的可用服务列表。随后,在客户端发送请求时通过负载均衡算法选择一个服务端实例再进行访问,以达到负载均衡的目的。通过分析代码可以发现,Ribbon 内部的 updateZoneServerMapping 方法的参数 Map> map 基本等同于每次更新动作最后所更新的可用服务列表。我们只需要配置一条规则来获取这个方法的入参就可以获取到当时真实的可用服务列表信息。

小节

本文以一个假象的场景出发,介绍了微服务引擎 MSE(Microservices Engine)微服务治理功能模块中微服务洞察功能的应用场景和简单的使用介绍。借助微服务洞察,我们可以便捷地观测到一些不被标准可观测系统覆盖的角落。在提供任意位置类粒度的动态信息采集这一核心能力的同时,我们也会结合微服务开发者们的微服务开发运维经验,不断去探索更多有价值的微服务场景,在核心能力的基础上以更加贴近场景的方式收集并采集信息,旨在帮助我们更好地治理我们的微服务应用,助力于云上帮助企业构建完整的微服务体系。欢迎大家尝鲜与体验~

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

/阅读下一篇/

阿里云全力服务生而全球的企业!

返回网易首页 下载网易新闻客户端
相关推荐
热点推荐
中国的教师过剩危机正加速成为现实。

中国的教师过剩危机正加速成为现实。

玉辞心
2025-06-24 07:28:06
72岁“唐僧”开始卖房!和陈丽华33年感情成笑话,百亿财产成空?

72岁“唐僧”开始卖房!和陈丽华33年感情成笑话,百亿财产成空?

大笑江湖史
2025-06-23 17:43:45
银行股大跌,重磅信号!

银行股大跌,重磅信号!

格隆汇
2025-06-27 18:34:11
洪森恼羞成怒,竟曝光英拉秘事,佩通坦绝地反击,泰专机直飞中国

洪森恼羞成怒,竟曝光英拉秘事,佩通坦绝地反击,泰专机直飞中国

叹知
2025-06-23 10:34:33
温网签表出炉!德约与德雷珀同半区,半决赛打辛纳,阿卡签运爆棚

温网签表出炉!德约与德雷珀同半区,半决赛打辛纳,阿卡签运爆棚

搏击江湖
2025-06-27 20:07:59
十三太保拼尽全力,苏超冠军奖杯惊艳亮相引发热议。

十三太保拼尽全力,苏超冠军奖杯惊艳亮相引发热议。

蜡笔小丸子
2025-06-27 10:19:01
一觉醒来,中俄关系迎质变!普京点名中国,中方果然没看错人

一觉醒来,中俄关系迎质变!普京点名中国,中方果然没看错人

博览历史
2025-06-26 17:30:02
孙继海:霍顿对我影响最深刻,他是中国足球的启蒙者

孙继海:霍顿对我影响最深刻,他是中国足球的启蒙者

直播吧
2025-06-27 15:13:05
深度分析一下:为什么“伊朗们”必须每次都要赢麻了才行呢?

深度分析一下:为什么“伊朗们”必须每次都要赢麻了才行呢?

翻开历史和现实
2025-06-26 00:25:15
我行我上!奥纳纳在家乡野球场踢前锋,网友:请把霍伊伦换掉

我行我上!奥纳纳在家乡野球场踢前锋,网友:请把霍伊伦换掉

直播吧
2025-06-27 09:44:07
中国记者遭乌无人机袭击受伤,俄外交部回应:乌军袭击为恐怖主义,祝愿中国记者早日康复

中国记者遭乌无人机袭击受伤,俄外交部回应:乌军袭击为恐怖主义,祝愿中国记者早日康复

扬子晚报
2025-06-27 10:11:17
三位港独艺人妄图内地捞金,遭遇滑铁卢!演唱会取消,全面遭抵制

三位港独艺人妄图内地捞金,遭遇滑铁卢!演唱会取消,全面遭抵制

归史
2025-06-06 14:49:41
雷佳音还有11部存片,全是大制作,观众直呼烦死了

雷佳音还有11部存片,全是大制作,观众直呼烦死了

影视高原说
2025-06-27 10:32:57
最佳入睡时间是几点?研究表明:晚上10-11点间入睡最利于心血管健康,12点后入睡显著增加心血管风险

最佳入睡时间是几点?研究表明:晚上10-11点间入睡最利于心血管健康,12点后入睡显著增加心血管风险

华医网
2025-06-26 05:43:59
泰国打响战役!洪森接过指挥权,两国元首坐镇前线,大战爆发苗头

泰国打响战役!洪森接过指挥权,两国元首坐镇前线,大战爆发苗头

说说史事
2025-06-27 07:57:52
证监会停止降温股市!6月27日,股市将迎来重大变化?

证监会停止降温股市!6月27日,股市将迎来重大变化?

风口招财猪
2025-06-27 01:05:33
疯狂捡漏!湖人连签3人,三大潜力股入阵,缝缝补补又一年啊

疯狂捡漏!湖人连签3人,三大潜力股入阵,缝缝补补又一年啊

球童无忌
2025-06-27 11:54:48
港媒爆赵雅芝三个儿子都啃老,三个儿媳妇几个孙子也靠她养!

港媒爆赵雅芝三个儿子都啃老,三个儿媳妇几个孙子也靠她养!

动物奇奇怪怪
2025-06-27 16:39:20
何恺明新身份:谷歌DeepMind杰出科学家

何恺明新身份:谷歌DeepMind杰出科学家

机器之心Pro
2025-06-26 10:28:14
只有房子涨价,而且是快速涨价,我们的经济才会好转。

只有房子涨价,而且是快速涨价,我们的经济才会好转。

流苏晚晴
2025-06-27 19:08:22
2025-06-27 23:11:00
阿里云云栖号
阿里云云栖号
阿里云官方内容社区!
3051文章数 865关注度
往期回顾 全部

科技要闻

雷军:小米汽车成功没靠营销,靠的是能力

头条要闻

68岁大爷满身纹身高铁飞机坐不了 亲友躲着走:老妖怪

体育要闻

中国足协官方宣布伊万科维奇下课 久尔杰维奇出任代理主帅

娱乐要闻

实至名归!蒋欣获白玉兰最佳女配角奖

财经要闻

合新铁路建设材料以次充好 多家单位被罚

汽车要闻

配置升级/贵宾座椅 全新GL8陆上公务舱售22.99万

态度原创

教育
亲子
手机
公开课
军事航空

教育要闻

昌平感知觉统合培训班结业式暨巩华中心小学一体化生态课间研讨会

亲子要闻

无奇不有,龙凤胎同时出生竟一母双父,医生坦言不奇怪,女方全责

手机要闻

小米MIX Flip2线下上手:体验后,说说真实感受

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

美媒揭美军37小时奔袭伊朗细节