网易首页 > 网易号 > 正文 申请入驻

一个架构师的缓存修炼之路

0
分享至

本文作者:张勇,现任科大讯飞高级架构师。11年后端经验,曾就职于同程艺龙、神州优车等公司。乐于分享、热衷通过自己的实践经验平铺对技术的理解。

一位七牛的资深架构师曾经说过这样一句话:

Nginx+业务逻辑层+数据库+缓存层+消息队列,这种模型几乎能适配绝大部分的业务场景。

这么多年过去了,这句话或深或浅地影响了我的技术选择,以至于后来我花了很多时间去重点学习缓存相关的技术。

我在10年前开始使用缓存,从本地缓存、到分布式缓存、再到多级缓存,踩过很多坑。下面我结合自己使用缓存的历程,谈谈我对缓存的认识。

01 本地缓存

1. 页面级缓存

我使用缓存的时间很早,2010年左右使用过 OSCache,当时主要用在 JSP 页面中用于实现页面级缓存。伪代码类似这样:
some jsp content
中间的那段 JSP 代码将会以 key="foobar" 缓存在 session 中,这样其他页面就能共享这段缓存内容。在使用 JSP 这种远古技术的场景下,通过引入 OSCache 之后 ,页面的加载速度确实提升很快。但随着前后端分离以及分布式缓存的兴起,服务端的页面级缓存已经很少使用了。但是在前端领域,页面级缓存仍然很流行。

2. 对象缓存

2011年左右,开源中国的红薯哥写了很多篇关于缓存的文章。他提到:开源中国每天百万的动态请求,只用 1 台 4 Core 8G 的服务器就扛住了,得益于缓存框架 Ehcache。这让我非常神往,一个简单的框架竟能将单机性能做到如此这般,让我欲欲跃试。于是,我参考红薯哥的示例代码,在公司的余额提现服务上第一次使用了 Ehcache。逻辑也很简单,就是将成功或者失败状态的订单缓存起来,这样下次查询的时候,不用再查询支付宝服务了。伪代码类似这样:

添加缓存之后,优化的效果很明显 , 任务耗时从原来的40分钟减少到了5~10分钟。
上面这个示例就是典型的「对象缓存」,它是本地缓存最常见的应用场景。相比页面缓存,它的粒度更细、更灵活,常用来缓存很少变化的数据,比如:全局配置、状态已完结的订单等,用于提升整体的查询速度。

3. 刷新策略

2018年,我和我的小伙伴自研了配置中心,为了让客户端以最快的速度读取配置, 本地缓存使用了 Guava,整体架构如下图所示:

那本地缓存是如何更新的呢?有两种机制:

  1. 客户端启动定时任务,从配置中心拉取数据。
  2. 当配置中心有数据变化时,主动推送给客户端。这里我并没有使用websocket,而是使用了 RocketMQ Remoting 通讯框架。

后来我阅读了 Soul 网关的源码,它的本地缓存更新机制如下图所示,共支持 3 种策略:

▍zookeeper watch机制

soul-admin 在启动的时候,会将数据全量写入 zookeeper,后续数据发生变更时,会增量更新 zookeeper 的节点。与此同时,soul-web 会监听配置信息的节点,一旦有信息变更时,会更新本地缓存。

▍websocket 机制

websocket 和 zookeeper 机制有点类似,当网关与 admin 首次建立好 websocket 连接时,admin 会推送一次全量数据,后续如果配置数据发生变更,则将增量数据通过 websocket 主动推送给 soul-web。

▍http 长轮询机制

http请求到达服务端后,并不是马上响应,而是利用 Servlet 3.0 的异步机制响应数据。当配置发生变化时,服务端会挨个移除队列中的长轮询请求,告知是哪个 Group 的数据发生了变更,网关收到响应后,再次请求该 Group 的配置数据。

不知道大家发现了没?

  1. pull 模式必不可少
  2. 增量推送大同小异

长轮询是一个有意思的话题 , 这种模式在 RocketMQ 的消费者模型也同样被使用,接近准实时,并且可以减少服务端的压力。

02 分布式缓存

关于分布式缓存, memcached 和 Redis 应该是最常用的技术选型。相信程序员朋友都非常熟悉了,我这里分享两个案例。

1. 合理控制对象大小及读取策略

2013年,我服务一家彩票公司,我们的比分直播模块也用到了分布式缓存。当时,遇到了一个 Young GC 频繁的线上问题,通过 jstat 工具排查后,发现新生代每隔两秒就被占满了。进一步定位分析,原来是某些 key 缓存的 value 太大了,平均在 300K左右,最大的达到了500K。这样在高并发下,就很容易导致 GC 频繁。找到了根本原因后,具体怎么改呢?我当时也没有清晰的思路。于是,我去同行的网站上研究他们是怎么实现相同功能的,包括:360彩票,澳客网。我发现了两点:

1、数据格式非常精简,只返回给前端必要的数据,部分数据通过数组的方式返回
2、使用 websocket,进入页面后推送全量数据,数据发生变化推送增量数据

再回到我的问题上,最终是用什么方案解决的呢?当时,我们的比分直播模块缓存格式是 JSON 数组,每个数组元素包含 20 多个键值对, 下面的 JSON 示例我仅仅列了其中 4 个属性。

[{ "playId":"2399", "guestTeamName":"小牛", "hostTeamName":"湖人", "europe":"123" }]

这种数据结构,一般情况下没有什么问题。但是当字段数多达 20 多个,而且每天的比赛场次非常多时,在高并发的请求下其实很容易引发问题。

基于工期以及风险考虑,最终我们采用了比较保守的优化方案:

1)修改新生代大小,从原来的 2G 修改成 4G2)将缓存数据的格式由 JSON 改成数组,如下所示:

[["2399","小牛","湖人","123"]]

修改完成之后, 缓存的大小从平均 300k 左右降为 80k 左右,YGC 频率下降很明显,同时页面响应也变快了很多。

但过了一会,cpu load 会在瞬间波动得比较高。可见,虽然我们减少了缓存大小,但是读取大对象依然对系统资源是极大的损耗,导致 Full GC 的频率也不低。

3)为了彻底解决这个问题,我们使用了更精细化的缓存读取策略。

我们把缓存拆成两个部分,第一部分是全量数据,第二部分是增量数据(数据量很小)。页面第一次请求拉取全量数据,当比分有变化的时候,通过 websocket 推送增量数据。

第 3 步完成后,页面的访问速度极快,服务器的资源使用也很少,优化的效果非常优异。

经过这次优化,我理解到: 缓存虽然可以提升整体速度,但是在高并发场景下,缓存对象大小依然是需要关注的点,稍不留神就会产生事故。另外我们也需要合理地控制读取策略,最大程度减少 GC 的频率 , 从而提升整体性能。

2. 分页列表查询

列表如何缓存是我非常渴望和大家分享的技能点。这个知识点也是我 2012 年从开源中国上学到的,下面我以「查询博客列表」的场景为例。我们先说第 1 种方案:对分页内容进行整体缓存。这种方案会按照页码和每页大小组合成一个缓存key,缓存值就是博客信息列表。假如某一个博客内容发生修改, 我们要重新加载缓存,或者删除整页的缓存。这种方案,缓存的颗粒度比较大,如果博客更新较为频繁,则缓存很容易失效。下面我介绍下第 2 种方案:仅对博客进行缓存。流程大致如下:1)先从数据库查询当前页的博客id列表,sql类似:select id from blogs limit 0,10 2)批量从缓存中获取博客id列表对应的缓存数据 ,并记录没有命中的博客id,若没有命中的id列表大于0,再次从数据库中查询一次,并放入缓存,sql类似:select id from blogs where id in (noHitId1, noHitId2)3)将没有缓存的博客对象存入缓存中4)返回博客对象列表理论上,要是缓存都预热的情况下,一次简单的数据库查询,一次缓存批量获取,即可返回所有的数据。另外,关于缓存批量获取,如何实现?

  1. 本地缓存:性能极高,for 循环即可
  2. memcached:使用 mget 命令
  3. Redis:若缓存对象结构简单,使用 mget 、hmget命令;若结构复杂,可以考虑使用 pipleline,lua脚本模式

第 1 种方案适用于数据极少发生变化的场景,比如排行榜,首页新闻资讯等。第 2 种方案适用于大部分的分页场景,而且能和其他资源整合在一起。举例:在搜索系统里,我们可以通过筛选条件查询出博客 id 列表,然后通过如上的方式,快速获取博客列表。

03 多级缓存

首先要明确为什么要使用多级缓存?本地缓存速度极快,但是容量有限,而且无法共享内存。分布式缓存容量可扩展,但在高并发场景下,如果所有数据都必须从远程缓存种获取,很容易导致带宽跑满,吞吐量下降。有句话说得好,缓存离用户越近越高效!使用多级缓存的好处在于:高并发场景下, 能提升整个系统的吞吐量,减少分布式缓存的压力。2018年,我服务的一家电商公司需要进行 app 首页接口的性能优化。我花了大概两天的时间完成了整个方案,采取的是两级缓存模式,同时利用了 guava 的惰性加载机制,整体架构如下图所示:

缓存读取流程如下:

1、业务网关刚启动时,本地缓存没有数据,读取 Redis 缓存,如果 Redis 缓存也没数据,则通过 RPC 调用导购服务读取数据,然后再将数据写入本地缓存和 Redis 中;若 Redis 缓存不为空,则将缓存数据写入本地缓存中。

2、由于步骤1已经对本地缓存预热,后续请求直接读取本地缓存,返回给用户端。

3、Guava 配置了 refresh 机制,每隔一段时间会调用自定义 LoadingCache 线程池(5个最大线程,5个核心线程)去导购服务同步数据到本地缓存和 Redis 中。

优化后,性能表现很好,平均耗时在 5ms 左右。最开始我以为出现问题的几率很小,可是有一天晚上,突然发现 app 端首页显示的数据时而相同,时而不同。

也就是说: 虽然 LoadingCache 线程一直在调用接口更新缓存信息,但是各个服务器本地缓存中的数据并非完成一致。说明了两个很重要的点:

1、惰性加载仍然可能造成多台机器的数据不一致

2、 LoadingCache 线程池数量配置的不太合理, 导致了线程堆积

最终,我们的解决方案是:1、惰性加载结合消息机制来更新缓存数据,也就是:当导购服务的配置发生变化时,通知业务网关重新拉取数据,更新缓存。2、适当调大 LoadigCache 的线程池参数,并在线程池埋点,监控线程池的使用情况,当线程繁忙时能发出告警,然后动态修改线程池参数。写在最后

缓存是非常重要的一个技术手段。如果能从原理到实践,不断深入地去掌握它,这应该是技术人员最享受的事情。

这篇文章属于缓存系列的开篇,更多是把我 10 多年工作中遇到的典型问题娓娓道来,并没有非常深入地去探讨原理性的知识。

我想我更应该和朋友交流的是:如何体系化的学习一门新技术。

  1. 选择该技术的经典书籍,理解基础概念
  2. 建立该技术的知识脉络
  3. 知行合一,在生产环境中实践或者自己造轮子
  4. 不断复盘,思考是否有更优的方案

后续我会连载一些缓存相关的内容:包括缓存的高可用机制、codis 的原理等,欢迎大家继续关注。

关于缓存,如果你有自己的心得体会或者想深入了解的内容,欢迎评论区留言。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
浙江一地开启集中供暖,采暖季费用3000元左右

浙江一地开启集中供暖,采暖季费用3000元左右

上观新闻
2024-12-01 07:32:10
男子送跌倒的老人回家,临走时,老人送男子两根盘龙金鞭

男子送跌倒的老人回家,临走时,老人送男子两根盘龙金鞭

书中自有颜如玉
2024-12-01 12:34:16
经济学家付鹏2024年终回顾《对冲风险VS软着陆》

经济学家付鹏2024年终回顾《对冲风险VS软着陆》

三言四拍
2024-12-01 08:56:21
延长股市交易时间!12月1日,今日凌晨的四大消息全面发酵!

延长股市交易时间!12月1日,今日凌晨的四大消息全面发酵!

风口招财猪
2024-12-01 01:15:21
抓壮丁!俄罗斯警方突袭莫斯科的多家夜总会,扣押人员强服兵役

抓壮丁!俄罗斯警方突袭莫斯科的多家夜总会,扣押人员强服兵役

军迷战情室
2024-11-30 19:38:08
网传复旦大学非全日制博士收费标准,四年48万!网友调侃:这是学位创收

网传复旦大学非全日制博士收费标准,四年48万!网友调侃:这是学位创收

可达鸭面面观
2024-11-30 23:19:41
太惨!北京一男子因吃“驴打滚”窒息身亡后续:新婚夫妻

太惨!北京一男子因吃“驴打滚”窒息身亡后续:新婚夫妻

小人物看尽人间百态
2024-11-30 18:25:44
马斯克透漏:特斯拉将打造7座 MPV,瞄准家庭用户“奶爸车” 市场

马斯克透漏:特斯拉将打造7座 MPV,瞄准家庭用户“奶爸车” 市场

沙雕小琳琳
2024-12-01 15:21:13
央视终于报道了“先用后付”,简直就是流氓行径

央视终于报道了“先用后付”,简直就是流氓行径

艾米手工作品
2024-11-30 11:52:21
一只鸡从肉到屎,看林彪的豁达

一只鸡从肉到屎,看林彪的豁达

小刀99
2024-12-01 14:40:38
气死人!辽宁,一老板发工资被银行拒绝取钱,必须先联系警方,民警到后让男子证明钱是合法的!

气死人!辽宁,一老板发工资被银行拒绝取钱,必须先联系警方,民警到后让男子证明钱是合法的!

读史
2024-12-01 07:08:37
月薪过万,儿童成长陪伴师是育儿救星吗?

月薪过万,儿童成长陪伴师是育儿救星吗?

上观新闻
2024-11-29 09:19:21
台湾女主持穿全!透!明雨衣直播采访火上热搜!男生看完直呼:眼睛怀孕了啊啊

台湾女主持穿全!透!明雨衣直播采访火上热搜!男生看完直呼:眼睛怀孕了啊啊

经典段子
2024-11-30 22:40:51
现在是12月1号晚间,刚刚传来1个惊天大消息,要来大动作了吗?

现在是12月1号晚间,刚刚传来1个惊天大消息,要来大动作了吗?

股市皆大事
2024-12-01 15:16:25
比亚迪与供应商的第三波内幕来了

比亚迪与供应商的第三波内幕来了

清晖有墨
2024-11-30 18:50:44
重庆市艾滋病疫情总体处于低流行水平

重庆市艾滋病疫情总体处于低流行水平

上游新闻
2024-12-01 13:24:15
已婚少妇参加同学会喝醉,醒来已在酒店内:感觉体内有抽离的痛感

已婚少妇参加同学会喝醉,醒来已在酒店内:感觉体内有抽离的痛感

云端书馆
2024-12-01 09:10:48
被尔滨中央大街2位警花美到了 网友:东北警花,英姿飒爽

被尔滨中央大街2位警花美到了 网友:东北警花,英姿飒爽

大象新闻
2024-11-30 19:44:40
赏心悦目!33岁格里兹曼世界级过人+惊艳破门,现场视角,太牛了

赏心悦目!33岁格里兹曼世界级过人+惊艳破门,现场视角,太牛了

侧身凌空斩
2024-12-01 06:02:10
前体操冠军刘璇被指影射吴柳芳,部分网友纷纷发评论质疑

前体操冠军刘璇被指影射吴柳芳,部分网友纷纷发评论质疑

直播吧
2024-12-01 05:58:10
2024-12-01 18:48:49
ITPUB学院
ITPUB学院
分享技术干货,了解最新动态
923文章数 627关注度
往期回顾 全部

科技要闻

我国首个商业航天发射场首发成功

头条要闻

媒体:若美国取消中国最惠国待遇 对华平均关税将超60%

头条要闻

媒体:若美国取消中国最惠国待遇 对华平均关税将超60%

体育要闻

两翼齐废,凯恩受伤,还好拜仁有他!

娱乐要闻

黄晓明姥姥去世,祖孙俩手牵手好温馨

财经要闻

女首富,死刑!交出800亿,免死!

汽车要闻

科技是中国豪车梦的支点 腾势Z9走心试驾体验

态度原创

游戏
教育
本地
健康
艺术

《剑星》向玩家征求拍照模式的建议:尽力倾听!

教育要闻

孩子总发泄负面情绪怎么办?这份情绪管理指南快收好!

本地新闻

云游中国|来伦布夏果感受充满Passion的人生

花18万治疗阿尔茨海默病,值不值?

艺术要闻

故宫珍藏的墨迹《十七帖》,比拓本更精良,这才是地道的魏晋写法

无障碍浏览 进入关怀版