网易首页 > 网易号 > 正文 申请入驻

微服务洞察,让微服务更透明

0
分享至

来 源 | 阿里云云原生团队

微服务作为云原生时代下一种开发软件的架构和组织方法,通过将明确定义的功能分成更小的服务,并让每个服务独立迭代,增加了应用程序的灵活性,允许开发者根据需要更轻松地更改部分应用程序。同时每个微服务可以由单独的团队进行管理,使用适当的语言编写,并根据需要进行独立扩缩容。但微服务同样也并非“银弹”,在带来如此多的优势的同时,逐渐膨胀的微服务数量也为系统带来了空前的复杂度,服务之间错综复杂的调用、协作关系如同一层迷雾笼罩在系统之上,借助 Trace、Log、Metric 三驾马车我们的系统具备了一定的可观测性,但所能得到信息是标准化且固定的,往往不能够满足复杂场景下的观测需求,比如微服务引擎 MSE(Microservices Engine)中的微服务治理功能模块为用户用好微服务提供了诸多帮助,但其中的很多功能,比如全链路灰度、无损上下线等会涉及多个应用,且所涉及的信息又不被标准的可观测系统覆盖。而微服务洞察通过动态的信息采集能够填补这其中的一部分空缺,更好地满足这些微服务场景的观测需求,同时也将他们纳入到标准的观测体系中来。

微服务洞察

设想这样一个问题现场,线上系统出现了一个奇怪的问题,某一个接口偶现错误,频率不高,出现时间毫无规律,但是没有发现任何有效的错误日志。这时,在通常的实践中,除非具备脑内 debug 的神力,不然我们往往需要在代码中增加日志逻辑,然后重启应用,静静等待问题复现后查询日志,如果定位了问题范围需要更多的信息,就需要我们不断循环 编写日志逻辑->重启应用->静静等待 的步骤直到解决 bug。但这还不是最令人头疼的,如果给这个问题加上问题触发伴随应用重启、pod 内日志丢失、重启后问题无法复现等 debuff,排查的难度将会进一步上升。

而由于微服务洞察具备任意位置类粒度的动态信息采集的核心能力,能够帮助我们解决上述场景中的一些痛点。首先在第一次发现这个问题后,我们可以直接在线上环境中通过配置一条微服务洞察的规则,来收集一些初步信息来帮助我们判断可能的问题原因。由于收集的信息会以调用链的形式组织,我们可以从中获取问题出现的频率、时间、参数分布、上下游调用信息等。同时由于信息会直接上报并集中存储到远端系统,因此不受应用重启的影响,我们也不需要一台一台实例去查询日志。

在对问题有了初步的判断之后,我们往往能够将问题定位到一个范围之内,这时我们可以进一步锁定某些方法,通过配置规则,打印它们的入参、返回值、调用堆栈等信息来判断其执行是否符合预期。

通过上述的举例可以发现,借助微服务洞察的能力,我们能够轻松地探知标准的可观测系统难以触达的角落,从而满足我们对一些微服务场景的观测需求。

洞察微服务场景

无损下线

无损下线是微服务治理中的一个功能,主要是为了解决在发布过程中的微服务在下线的过程中可能存在的流量损失。其大致流程如下图所示。

通过一系列的策略和措施,能够做到服务的完全无损下线。但这样就导致无损下线的流程比较复杂,同时还涉及到多个节点之间的通知机制,特别是在大规模之下,下线流程的完整性以及可靠性的确认变得非常复杂与繁琐。这就是前文所提到的难以触达的角落,我们可以通过微服务洞察的能力帮助我们观测这个场景。

针对无损下线的场景,微服务洞察提供了场景化的规则,简单配置一键开启。

在开启了规则之后,微服务洞察会收集无损下线流程中值得关心的信息,组织成调用链的形式展示。如下图场景,我们对 108 节点进行缩容操作,我们就可以得到一条 Tracing 链路,其中包含主动通知、服务注销、应用停止等几个步骤,并且我们可以在每个步骤中看到所需的信息。

在主动通知环节我们可以看到当前 Provider 节点对哪些 Consumer 进行 GoAway 请求的调用,如下图所示我们将主动通知 10.0.0.90、10.0.0.176 两个 Consumer 节点。

当 Consumer 收到 GoAway 调用后,会进行负载均衡列表的刷新以及路由的隔离,我们将在负载均衡地址列表中显示最新抓到的当前 Consumer 对于当前服务缓存的最新地址列表,我们可以在下图中看到,地址列表中只剩下 10.0.0.204 这个服务提供者节点的调用地址。

我们也可以看到 Spring Cloud 向 Nacos(注册中心)执行服务下线的调用结果,注销成功。

微服务洞察通过将无损下线的 workflow 抽象成 Tracing 结构的策略,可以帮助我们降低大规模场景、复杂链路下无损下线问题的排查成本。

全链路灰度

全链路灰度是微服务治理中的另一个功能。有时某个功能发版依赖多个服务同时升级上线,我们希望可以对这些服务的新版本同时进行小流量灰度验证,这就是微服务架构中特有的全链路灰度场景,通过构建从网关到整个后端服务的环境隔离来对多个不同版本的服务进行灰度验证。在发布过程中,我们只需部署服务的灰度版本,流量在调用链路上流转时,由流经的网关、各个中间件以及各个微服务来识别灰度流量,并动态转发至对应服务的灰度版本。如下图:

而在使用该能力的时候,要想探清流量的匹配情况以及流量的走向具有较大的难度。而借助微服务洞察的能力可以帮助我们便捷地感知这些信息。

这部分的示例将基于 A、B、C 三个应用,其中 A、B 应用分别部署一个基线版本和一个灰度版本,其内部存在 /a -> /b -> /c 的调用链路。

我们只需要配置如下的规则可以看到流量的路径,以及实例和流量的标签信息。

从所展示的信息中可以看到,灰度流量正确地流经了灰度实例而不是非灰度实例(其中 mse.app.tag 是应用的标签,mse.tag 是流量的标签)

全链路灰度支持按照 headers 中的信息来匹配灰度流量,因此我们也在上一条规则的基础上,增加如下的规则来观测灰度流量的 headers 信息,来帮助我们判断流量匹配是否符合预期。

开启规则后,对于 /a -> /b -> /c 链路中的带有 gray 全链路灰度标签的流量,会在采集上一条规则所定义的信息的基础上,同时采集 Headers 信息,在链路展示页面详情展示如下:

借助微服务洞察的能力,我们只需要简单的规则配置,就可以完成对复杂的全链路灰度场景的观测,让我们在使用全链路灰度时不再提心吊胆。

引用的框架/组件内部

微服务架构下的开发往往会使用很多框架或是中间件,这些框架和中间件的内部无法添加日志逻辑,因此在使用时对开发者来说时黑盒的,极大地增加了观测的难度。而借助微服务洞察,任意位置都只需要通过配置规则的方式就可以获取到现场信息。接下来以负载均衡和 Nacos 为例。

Nacos

Nacos 借用官网的描述,致力于帮助您发现、配置和管理微服务。Nacos 提供了一组简单易用的特性集,帮助您快速实现动态服务发现、服务配置、服务元数据及流量管理。处于微服务架构中的关键位置,但是目前在可观测方面 Nacos 服务端能够获取一些信息,但是客户端则成了黑暗的角落,开发者也不能随意地添加日志信息,想要关注其中的信息难上加难。而在微服务洞察的帮助下,通过简单的规则配置,就可以获取到客户端内部的信息,来补全这部分的观测需求。

我们以服务变更回调的方法以及收取订阅服务内容的方法为例,前者会在所订阅的服务发生变更时被触发,后者会在收到订阅的服务内容时被触发,通过关注这两个方法的入参,我们便可以获取到此时服务的详细信息。

负载均衡

以 Spring Cloud 常用的客户端负载均衡组件 Ribbon 作为示例,Ribbon 位于客户端一侧,通过服务注册中心(本文中为 Nacos)获取到一份服务端提供的可用服务列表。随后,在客户端发送请求时通过负载均衡算法选择一个服务端实例再进行访问,以达到负载均衡的目的。通过分析代码可以发现,Ribbon 内部的 updateZoneServerMapping 方法的参数 Map> map 基本等同于每次更新动作最后所更新的可用服务列表。我们只需要配置一条规则来获取这个方法的入参就可以获取到当时真实的可用服务列表信息。

小节

本文以一个假象的场景出发,介绍了微服务引擎 MSE(Microservices Engine)微服务治理功能模块中微服务洞察功能的应用场景和简单的使用介绍。借助微服务洞察,我们可以便捷地观测到一些不被标准可观测系统覆盖的角落。在提供任意位置类粒度的动态信息采集这一核心能力的同时,我们也会结合微服务开发者们的微服务开发运维经验,不断去探索更多有价值的微服务场景,在核心能力的基础上以更加贴近场景的方式收集并采集信息,旨在帮助我们更好地治理我们的微服务应用,助力于云上帮助企业构建完整的微服务体系。欢迎大家尝鲜与体验~

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
释永信害惨四位女星:央视台柱、乐坛歌后、刘涛最冤

释永信害惨四位女星:央视台柱、乐坛歌后、刘涛最冤

暖心萌阿菇凉
2026-05-31 18:11:11
王菲看演唱会,却把俞飞鸿送上了热搜?两个“老阿姨”的状态

王菲看演唱会,却把俞飞鸿送上了热搜?两个“老阿姨”的状态

童叔不飙车
2026-05-31 23:06:29
总决赛票价悬殊!尼克斯主场门票最高30万美元,马刺主场仅需千元

总决赛票价悬殊!尼克斯主场门票最高30万美元,马刺主场仅需千元

夜白侃球
2026-06-01 12:18:58
在国安局退休后,发现邻居每天准时晒被子,被子颜色是在传递机密

在国安局退休后,发现邻居每天准时晒被子,被子颜色是在传递机密

千秋文化
2026-05-28 19:38:07
刚官宣就撞车!比亚迪智驾兜底首案来了,车主已报案

刚官宣就撞车!比亚迪智驾兜底首案来了,车主已报案

北纬的咖啡豆
2026-05-31 14:40:49
除了俄乌战争,还有一场伤亡更大的战争已经打了两年多

除了俄乌战争,还有一场伤亡更大的战争已经打了两年多

商业模式桑博士
2026-05-29 07:49:46
外卖骑手过剩,网约车市场饱和,说明什么问题?

外卖骑手过剩,网约车市场饱和,说明什么问题?

历史总在押韵
2026-05-31 19:42:33
香会闹崩,多国代表遗憾离场,崔天凯回国前,留下极具分量一番话

香会闹崩,多国代表遗憾离场,崔天凯回国前,留下极具分量一番话

影孖看世界
2026-06-01 15:52:35
法网第9日:阿利亚西姆创历史 萨巴伦卡夜战大阪直美

法网第9日:阿利亚西姆创历史 萨巴伦卡夜战大阪直美

快乐加载中21
2026-06-02 02:21:47
很多房子已经租不出去了。

很多房子已经租不出去了。

老陆不老
2026-05-31 12:37:09
日本62岁皇后复出,中日关系迎历史转折

日本62岁皇后复出,中日关系迎历史转折

空谷幽幽蓝
2026-06-01 11:10:37
叙利亚,为什么没人再提了?

叙利亚,为什么没人再提了?

民间胡扯老哥
2026-05-22 06:48:12
从58万到169万!一网友哭诉自己被高收入绑架,丢掉了生活的意义

从58万到169万!一网友哭诉自己被高收入绑架,丢掉了生活的意义

火山詩话
2026-05-31 10:57:09
纪委核查通讯记录的独门手段,很多人到落马都不知道

纪委核查通讯记录的独门手段,很多人到落马都不知道

细说职场
2026-06-01 18:36:34
再次交火后,美军发现伊朗18座地下导弹基地,已被推土机修复

再次交火后,美军发现伊朗18座地下导弹基地,已被推土机修复

兵国大事
2026-06-01 22:02:55
辽宁省气象台继续发布强对流天气蓝色预警 +大风预报!

辽宁省气象台继续发布强对流天气蓝色预警 +大风预报!

辽宁卫视
2026-06-01 16:18:14
“香会”25年,中美两大主角主导安全对话“音量”

“香会”25年,中美两大主角主导安全对话“音量”

环球网资讯
2026-06-01 06:36:08
老婆出轨后,我去找对方老婆,谁料他老婆:给你套房,但有个条件

老婆出轨后,我去找对方老婆,谁料他老婆:给你套房,但有个条件

千秋文化
2026-05-29 19:56:40
俞浩的盖头马上要被揭开了

俞浩的盖头马上要被揭开了

未来之地
2026-06-01 21:54:32
偷偷结婚生子?移民国外?李梓萌消失2月引争议,担心的事发生了

偷偷结婚生子?移民国外?李梓萌消失2月引争议,担心的事发生了

离离言几许
2026-03-16 16:31:23
2026-06-02 06:55:00
阿里云云栖号
阿里云云栖号
阿里云官方内容社区!
3477文章数 867关注度
往期回顾 全部

科技要闻

黄仁勋演讲实录|40年来PC首次重设计!

头条要闻

伊朗计划彻底封锁霍尔木兹海峡 特朗普回应

头条要闻

伊朗计划彻底封锁霍尔木兹海峡 特朗普回应

体育要闻

杰威:如果我没受伤,我们能击败马刺

娱乐要闻

奚梦瑶婚礼现场图!一双儿女当花童

财经要闻

宇树过会,杭州赢麻了

汽车要闻

奇瑞集团5月销量24.8万辆 同比增长20.5% 出口18.2万辆再创新高

态度原创

游戏
手机
艺术
亲子
时尚

LPL最圈粉战队诞生!曾是LPL豪门落寞多年,如今上万人打出满分

手机要闻

华为nova 16系列支持5A速度!传输、流畅度领先友商17 Pro

艺术要闻

周杰伦花 1.36 亿拍下的这幅画

亲子要闻

《欢乐彝族娃》少儿节目#少儿舞蹈 #群舞 #少儿节目 #集体

夏天裤子不用多买,阔腿裤一整个夏天都能穿,日常出行好打理

无障碍浏览 进入关怀版