网易首页 > 网易号 > 正文 申请入驻

性能全面提升!白山云基于StarRocks替换ClickHouse的数据库实践

0
分享至

StarRocks 是国产开源、极速全场景MPP数据库,它采用新一代弹性MPP架构,可以高效支持大数据量级的多维分析、实时分析、高并发分析等多种数据分析场景,性能出色,比同类产品平均快3-5倍。

白山云大数据团队在两年多的学习和实践中,基于StarRocks搭建了全新的大数据平台,并已全量投入使用。因此我们将选型接入、改造优化的过程与经验进行分享,希望能为大家带来一些借鉴与思考。

选型思考

白山云CDN每天数万亿次访问的规模下,面对业务方需要实现全网日志写入分钟级延迟,查询毫秒级响应,旧的数据架构在性能、规模、分析与挖掘上都面临巨大挑战,大数据团队对数据底座提出了更高的要求。

在引入StarRocks之前,白山云大数据团队采用ClickHouse作为分布式数据库。ClickHouse是一个面向列的开源数据库管理系统,它使用C++编写,并支持SQL查询语言。随着业务的发展,ClickHouse逐渐暴露出一些明显的问题,例如查询速度慢、横向扩展能力差、数据写入时延长、故障恢复用时较长等。当遇到故障或问题时,ClickHouse全靠文档和阅读源码,这更造成解决问题的途径又变成新的问题。

因此白山云大数据团队开始寻找替代方案,目标是找到一款高性能、高可用的分布式数据库。经过选型评估,最终选择了 StarRocks 作为数据平台的底座。

我们认为StarRocks 主要的优点如下:

1、基于pipeline查询引擎和物化视图两大特性,StarRocks 查询性能在同类数据库中具有明显优势,尤其是物化视图机制可以做到数据在写入时自动完成上层的细粒度聚合,无需单独跑聚合任务,在获得更低延迟的同时节省了大量的任务资源。

2、默认3副本,单一节点宕机对集群无任何影响。

3、支持MySQL协议,支持MySQL数据库无缝切换。

4、在缩减或扩容资源时,只需一行命令,无需重启集群即可自动完成扩缩容,不会对稳定性造成影响,这也是ClickHouse无法支持的。

我们对比了10种业务常用查询场景,在近似硬件环境下(StarRocks:9台40Core 128GB 8TB * 12HDD硬盘, ClickHouse:14台 32Core 64GB 4TB * 8HDD硬盘),StarRocks的平均查询速度比ClickHouse提高了200%-1600%灰色的为ClickHouse无法在60s内返回结果的情况:

StarRocks在白山云的优化实践

在此期间,白山云大数据团队不断摸索与调优,使得业务达到了相对满意的效果,在这里也将经验进行分享。

StarRocks数据接入改造:

首先是StarRocks受限于自身的架构问题,不支持过高的写入频率,否则会高频触发压缩机制,影响集群稳定性,因此白山云大数据团队在StarRocks上游自行开发了Agglog组件,所有写入方将数据统一由HTTP接口提交到Agglog接口,由Agglog定时写入StarRocks,保证写入数据频率可控。

StarRocks数据查询改造:

StarRocks在多机房部署集群,针对重保数据同时写入多个机房,然后由ProxySQL组件提供数据查询,同时设计集群稳定性监测组件,实时观测每个IDC的集群性能和稳定性,在单一IDC发生稳定性抖动时,集群稳定性监测组件会自动修改ProxySQL的配置,此时用户通过ProxySQL查询时就自动查到了另一个机房获取结果。

StarRocks稳定性提升策略:

为预防StarRocks单一节点抖动,大数据团队针对StarRocks集群配置了内部域名,所有查询、写入均使用域名访问,当集群需要进行扩缩容或者节点发生异常宕机时,可自助修改域名,使用方无需任何操作即可访问新节点、下掉旧节点,实现了无痛甚至无感知的扩缩容。

此外,大数据团队还针对自身业务逻辑和StarRocks的架构组成,设计了几十个监控维度和告警指标。在集群发生慢查询、慢压缩、节点抖动、查询写入突增突降等多个异常场景时,自动发出告警,进行自动处理或者等待人工介入。

StarRocks的实践成效与价值

1、业务价值:受益于StarRocks的架构优势,引入StarRocks后多个之前无法满足的需求场景得到了开发的机会,并得到业务部门的良好反馈,例如:

(1)万亿量级数据承载能力:每天万亿级别的用户请求日志分散在全球的数万台边缘服务器,由于数据量过于庞大,在旧架构中,中心数据仓库仅存储了秒级粒度到分钟粒度的聚合数据,在部分特定需求场景下非常不方便。引入StarRocks 后,基于StarRocks的湖仓一体特性,将全量的CDN明细日志接入了hudi集群,并通过StarRocks作为查询引擎对外提供查询。业务方可以无需额外的学习成本,快速地检索到明细的CDN请求日志的明细数据。

(2)数据入库时延降低期望:传统的数仓分层每一层都要数据落盘,上一层计算完成后下一层任务才开始执行,整体数据时延较长。改为写入StarRocks后,受益于StarRocks物化视图特性,在查询聚合数据的使用场景下,查询速度获得了2-16倍的提升,聚合表的数据延迟由15min降低到了2-3min。

(3)聚合数据毫秒响应需求:在全量接入StarRocks数据库之后,基于StarRocks的高性能低延迟,针对各类业务绘制了质量大盘、成本大盘,并针对下载速率、卡顿率等关键指标向外输出了低延迟的接口,为各个部门的性能优化,成本节约,调度策略优化,故障节点摘除等模块提供有效的数据支撑。

从实践结果来看,StarRocks 能满足90%以上的需求场景,对白山云各业务线的数据分析应用起到了关键性作用。

2、对社区的贡献:在使用过程中,针对发现的各种问题,大数据团队对源码进行阅读分析,发现了一些bug,并主动修复回馈给了社区。基于白山云超大访问量的业务场景,为社区进一步发展完善StarRocks提供了许多有价值的参考:

未来规划

白山云大数据团队将进一步探索StarRocks冷热分离、湖仓一体、存算分离等多个全新模块,将StarRocks的性能发挥到极致。针对冷热分离,大数据团队已经进行了初步测试,以9台 1NVMe 12HDD的StarRocks BE节点集群为例,经过测试,热数据命中NVMe硬盘时,查询性能将是HDD硬盘的十倍以上。

作为白山云的技术底座,大数据团队将进一步对所有的StarRocks写入、查询收口,统一管理,拦截异常行为,提高集群性能,向各业务需求方提供更低延迟、更高性能、更加稳定的数据平台。

除此之外,未来我们将不再局限于问题修复类型的代码提交,而是要积极参与到社区新功能开发建设中,参与一些StarRocks新特性的开发。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
“香喷喷”中的喷,不读pēn,还是上小学的儿子纠正的我!

“香喷喷”中的喷,不读pēn,还是上小学的儿子纠正的我!

未央看点
2026-05-17 00:30:25
45岁才明白:微信上基本不发朋友圈的,十有八九是这两种人

45岁才明白:微信上基本不发朋友圈的,十有八九是这两种人

心理观察局
2026-05-08 09:43:07
日媒曝高市要访华,主动低头求和,并笃定一个事情,中方如何接招

日媒曝高市要访华,主动低头求和,并笃定一个事情,中方如何接招

基斯默默
2026-05-15 20:20:33
浙商证券男篮主场111:102力克深圳马可波罗,赢得半决赛开门红

浙商证券男篮主场111:102力克深圳马可波罗,赢得半决赛开门红

奔跑的象牙塔
2026-05-17 00:11:38
广东3消息!徐杰终止特训计划,杜锋发表讲话,萨林杰正式离队

广东3消息!徐杰终止特训计划,杜锋发表讲话,萨林杰正式离队

多特体育说
2026-05-16 23:42:03
太狂了!张本智和父亲公开放话,球迷怒了:以后别想再来中国了

太狂了!张本智和父亲公开放话,球迷怒了:以后别想再来中国了

青梅侃史啊
2026-05-16 09:52:38
硬刚天价垄断!央视5亿打包四届世界杯,FIFA为何被迫低头?

硬刚天价垄断!央视5亿打包四届世界杯,FIFA为何被迫低头?

落夜足球
2026-05-15 23:07:18
老板娘问我她屁股大不大?我该怎么回答?

老板娘问我她屁股大不大?我该怎么回答?

太急张三疯
2026-05-16 11:51:22
女性“巨阴症”可以生育吗?医生:主要看3种情况,不妨了解一下

女性“巨阴症”可以生育吗?医生:主要看3种情况,不妨了解一下

健康科普365
2026-05-03 09:30:28
夫妻本是同林鸟!但抱歉,这一次郭富城也救不了“作妖”的方媛

夫妻本是同林鸟!但抱歉,这一次郭富城也救不了“作妖”的方媛

揽星河的笔记
2026-05-15 20:11:07
大S年轻时房间曝光,太过诡异引人不适,难怪有人曾说活不过50岁

大S年轻时房间曝光,太过诡异引人不适,难怪有人曾说活不过50岁

草莓解说体育
2026-05-11 20:49:33
人类最大火箭更新:推力超1万吨,堪比055直接上天

人类最大火箭更新:推力超1万吨,堪比055直接上天

哎呀哎呀看电影
2026-05-16 09:17:34
杜锋下课王仕鹏接任,徐杰成核心,球迷万言书令朱芳雨沉默

杜锋下课王仕鹏接任,徐杰成核心,球迷万言书令朱芳雨沉默

林子说事
2026-05-16 10:14:33
凭什么让我滚出中国?张本智和回老家祭祖遭村民抵制,差点动手!

凭什么让我滚出中国?张本智和回老家祭祖遭村民抵制,差点动手!

拳击时空
2026-05-16 06:13:06
塞门约:努力终会有回报;我们所有人都很喜欢瓜帅

塞门约:努力终会有回报;我们所有人都很喜欢瓜帅

懂球帝
2026-05-17 00:33:23
美智库分析:歼-20雷达反射面为F-22百倍,战略目标不同

美智库分析:歼-20雷达反射面为F-22百倍,战略目标不同

一网打尽全球焦点
2026-05-15 03:38:00
黄仁勋赶飞机与中美“共建天坛”叙事:中美关系的张力与隐喻

黄仁勋赶飞机与中美“共建天坛”叙事:中美关系的张力与隐喻

澎湃新闻
2026-05-16 07:20:27
特朗普访华突然变“乖”?面子给足,筹码不放,中国早算准了他!

特朗普访华突然变“乖”?面子给足,筹码不放,中国早算准了他!

诗里寻那个他
2026-05-16 23:13:03
互联网是有记忆的,她的黑历史一大堆啊!

互联网是有记忆的,她的黑历史一大堆啊!

BenSir本色说
2026-04-15 22:38:07
马丁内斯:C罗踢球不是为了金钱与冠军荣誉,是为了不断突破自我

马丁内斯:C罗踢球不是为了金钱与冠军荣誉,是为了不断突破自我

林子说事
2026-05-16 18:18:32
2026-05-17 01:15:00
白山云科技
白山云科技
云计算服务商
255文章数 1关注度
往期回顾 全部

科技要闻

涨的是车价,要的是老命

头条要闻

13岁女孩被胁迫卖淫18次:主谋系其"好友" 未满16周岁

头条要闻

13岁女孩被胁迫卖淫18次:主谋系其"好友" 未满16周岁

体育要闻

马刺2号,少年老成,这集看过?

娱乐要闻

谢霆锋北京街头骑行被偶遇,侧颜帅炸

财经要闻

造词狂魔贾跃亭

汽车要闻

大五座SUV卷王!乐道L80上市 租电15.68万元起

态度原创

房产
家居
教育
时尚
军事航空

房产要闻

老黄埔热销之下,珠江春,为何去化仅3成?

家居要闻

110㎡淡而有致的生活表达

教育要闻

又开始偷偷卷排名的几所大学!

女人不管年纪多大,都可以备好一件经典条纹T恤,减龄又舒适

军事要闻

联合国安理会审议叙利亚局势

无障碍浏览 进入关怀版