网易首页 > 网易号 > 正文 申请入驻

PostgreSQL 15 中值得关注的“大更新”

0
分享至

摘要:以前,统计信息收集器通过UDP接收统计信息更新,并通过定期将统计信息数据写出到临时文件来共享统计信息数据。当文件达到数十兆字节时,每秒最多写出两次,这会阻止添加其他有用的统计数据。现在,PostgreSQL 15将做出了重大的改变,开始使用动态共享内存来收集统计信息,而不再使用文件和文件系统。

https://www.percona.com/blog/postgresql-15-stats-collector-gone-whats-new/

声明:本文为CSDN翻译,转载请注明来源。

作者 | Jobin Augustine

译者 | 朱珂欣 责编 | 屠敏

出品 | CSDN(ID:CSDNnews)

众所周知,PostgreSQL是一个功能强大的开源对象关系数据库系统,它使用并扩展了SQL语言,并结合了许多可安全存储和扩展最复杂数据工作负载的特性。一直以来,PostgreSQL都在业内拥有极高的声誉,它的每一次版本的发布,都能在国内外获得很大的关注度。

2022年6月30日,PostgreSQL全球开发组宣布PostgreSQL 15的第二个beta版本已可供下载,该版本包含将于2022年末发布的PostgreSQL 15正式版本中的所有特性和功能。

很多人将PostgreSQL 15与PostgreSQL 14相比较,就会发现有一个特别的更新——"统计信息收集器"不见了。曾经是无数开发者的开发瓶颈,如今已经永远消失了。作为PostgreSQL 14和更早版本都需要“统计信息收集器”,它存在怎样的问题呢?PostgreSQL 15又新增了什么样的功能?

被舍弃的统计信息收集器

PostgreSQL的统计信息收集器,是一个支持收集和报告服务器活动信息的子系统。它可以对表和索引的访问计数,以此累计统计信息。并且,还可以跟踪每个表中的总行数、每个表的清理和分析动作的信息,以及统计调用用户定义函数的次数和在每次调用中花费的总时间。

但是,PostgreSQL的统计信息收集器同样存在一些问题。

  • 信息传输受到阻力。

由于会话的每个后端是PostgreSQL中的单独进程,因此,收集统计信息并传输并不是容易的事。每个后端将有关它们执行的活动信息发送到单个“统计信息收集器”进程。在过去,这种通信是通过UDP套接字进行,在用户报告的不同类型问题中显示,有三类问题较为明显:统计数据过期;统计数据收集器不运行;自动真空不工作/不启动等。

并且,在过去如果统计数据收集器在特定机器上出现问题,用户其实很难理解出了什么问题。

  • 大量IO出现。

“统计信息收集器”还有一个不利影响——它引起的IO。如果启用DEBUG级别 2,可能会看到不断出现在PostgreSQL 日志中的消息,将导致数据目录所在的装入点上出现大量 IO。

下图是参数值stats_temp_directory所指向的位置。在许多系统上,它将是数据目录中pg_stat_tmp。在Ubuntu/Debian上,它将在/var/run/postgresql中,例如:

PostgreSQL 15中的新动作

面对统计信息收集器带来的弊端,如今,PostgreSQL 15开始使用动态共享内存来收集统计信息,而不再使用文件和文件系统。

正如Andres Freund在文中提及的:

以前,统计信息收集器通过UDP接收统计信息更新,并通过定期将统计信息数据写出到临时文件来共享统计信息数据。这些文件可以达到数十兆字节,并且每秒最多写出两次。这会阻止我们添加其他有用的统计数据。 现在,统计信息都存储在共享内存中。可以变化的编号对象的统计信息,存储在由动态共享内存支持的 dshash 哈希表中。固定编号的统计信息,存储在普通共享内存中。pgstat.c 的标题包含体系结构的概述。 不再需要统计信息收集器,请将其删除。

显然,参数stats_temp_directory已经消失。因此,不再需要pg_stat_tmp目录了,pg_stat_tmp目录是在数据目录或其他位置中创建的,所有统计文件都在此生成和读取。然而,仍保留它是因为不会破坏许多依赖于该目录的扩展,例如pg_stat_statements。

在加载扩展库之前,目录保持为空。例如,如果我们加载pg_stat_statements库,目录中会出现一个文件。

当然,这些扩展都并非免费的,需要成本。

在新架构中,大多数统计更新时,首先需要在每个进程中本地累积为"pending"(每个后端都有一个后端本地哈希表)。"pending"是指已累积但尚未提交到共享统计系统的待定信息。在提交后或超时后,会被刷入共享内存。

由于统计信息是在有人试图读取时被并发更新的,所以读取一致性就成了问题。为了解决读取一致性的问题=PostgreSQL 15引入了一个新的参数:stats_fetch_consistency。它可以取三个值,none、cache 、snapshot:

  • “none”是最有效的。如果存在期望的监视查询,则无法提供读取一致性。但对于大多数使用来说是可以的。

  • “cache ”能确保重复访问产生相同的值,对于涉及自联接的查询很重要。


  • “snapshot”在以交互方式检查统计信息时很有用,但开销更高。


stats_fetch_consistency的默认值为“cache ”。

更新迭代中的疑问与解答

面对PostgreSQL 15新版本中的重大调整,很多用户也会产生相关的疑惑。

  • 统计信息位于共享内存中,如何在重新启动后保存?

统计信息在关机前,由检查点进程写出到文件系统,并在启动期间由启动进程再次装回。像往常一样,如果发生崩溃,统计信息将会失效。

  • 新功能会影响监控工具/脚本吗?

显然是不会,所有的统计监测视图pg_stat_*仍能照常工作,但需要为stats_fetch_consistency选择适当的值。如上所述,保留pg_stat_tmp目录是为了不破坏使用这种方法开发的扩展。但是,扩展开发人员需要针对PostgreSQL 15彻底测试扩展。

  • 如何使用PostgreSQL等待事件,了解PostgreSQL及其会话在哪里花费的时间呢?

日常生活中使用的数据收集和分析工具,例如pg_gather,利用这些等待事件分析和了解问题。 因此,为了更好地监控,PostgreSQL还引入了三个新的等待事件。

  • PgSta tsDSA: 等待统计动态共享内存分配器访问。

  • PgStatsHash: 等待stats共享内存哈希表访问。

  • PgStatsData: 等待共享内存统计数据访问。

总的来说,PostgreSQL 15不再需要统计信息收集器,而是将统计信息都存储在共享内存中。随着统计收集器及其维护的所有开销的消失,其他子系统,例如自动真空系统,工作量将大大减少,经常查询统计信息的监控工具将会大大降低系统的负载。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
浙江女子夜骑遭轮奸,被折磨四小时后崩溃:他们两个人,反抗不了

浙江女子夜骑遭轮奸,被折磨四小时后崩溃:他们两个人,反抗不了

小鹿姐姐情感说
2024-12-05 10:30:03
中国掀桌了!美国半导体制裁升级,我方打出明牌:直接硬脱钩

中国掀桌了!美国半导体制裁升级,我方打出明牌:直接硬脱钩

胖福的小木屋
2024-12-04 23:54:33
琼瑶离去的原因,都藏在6天前的文字里,8年怨恨从来未曾放下

琼瑶离去的原因,都藏在6天前的文字里,8年怨恨从来未曾放下

米椒娱乐
2024-12-04 21:43:36
曼联狂喜?桑乔8场1球3助蓝军英超第2,后者排名越高买断费用越高

曼联狂喜?桑乔8场1球3助蓝军英超第2,后者排名越高买断费用越高

直播吧
2024-12-05 08:27:09
范德法特:伊布是个混蛋,在阿贾克斯我们吵了一架后他就去了尤文

范德法特:伊布是个混蛋,在阿贾克斯我们吵了一架后他就去了尤文

直播吧
2024-12-04 18:17:33
16岁白人男子自曝在上海随便睡女人,包括已婚女,骂中国女是“碧池”

16岁白人男子自曝在上海随便睡女人,包括已婚女,骂中国女是“碧池”

可达鸭面面观
2024-11-30 08:18:17
国产大飞机第二总部,争夺战又来了

国产大飞机第二总部,争夺战又来了

国民经略
2024-12-05 11:54:41
中国成功发射“海哨一号”:国内首颗光-SAR结合的新型遥感卫星

中国成功发射“海哨一号”:国内首颗光-SAR结合的新型遥感卫星

环球网资讯
2024-12-04 15:41:08
南京厉害了!拥有世界第一座“中国投资、中国建造”的摩天大楼

南京厉害了!拥有世界第一座“中国投资、中国建造”的摩天大楼

美人茶话会
2024-12-05 10:10:17
一脸褶子还打打杀杀,陈小春新片跌破底线,卖情怀成古惑仔养老院

一脸褶子还打打杀杀,陈小春新片跌破底线,卖情怀成古惑仔养老院

娱乐圈笔娱君
2024-12-02 11:09:59
年检新规中的OBD检测,是一门生意?就是为难车主?

年检新规中的OBD检测,是一门生意?就是为难车主?

车业杂谈
2024-12-05 09:43:36
善恶终有报:疫情时对中国一毛不拔,却大方捐美国6亿,如今咋样

善恶终有报:疫情时对中国一毛不拔,却大方捐美国6亿,如今咋样

博学老K杂谈
2024-10-15 14:00:02
普京终于回过神来,可惜中国已成全球第一

普京终于回过神来,可惜中国已成全球第一

军机图
2024-12-04 14:56:59
做了领导才知道,领导根本不在意你干了多少活,而是在意这3点

做了领导才知道,领导根本不在意你干了多少活,而是在意这3点

于观潭
2024-07-28 15:00:02
再见,奥运会!日本女足踢2-0假球,葬送中国女足,日媒:正确

再见,奥运会!日本女足踢2-0假球,葬送中国女足,日媒:正确

美人茶话会
2024-12-05 10:15:06
中美贸易结构的变化,已导致美方主导的贸易战实际上打不下去了!

中美贸易结构的变化,已导致美方主导的贸易战实际上打不下去了!

醉井观商
2024-12-04 21:03:41
美称新冠病毒最早或从我国实验室泄露,我方称不可信!该如何溯源

美称新冠病毒最早或从我国实验室泄露,我方称不可信!该如何溯源

科普大世界
2024-12-04 15:58:22
我做保姆月收入7000,儿媳妇做销售3000,到底谁该辞职带娃?

我做保姆月收入7000,儿媳妇做销售3000,到底谁该辞职带娃?

清水家庭故事
2024-12-04 08:13:13
常住人口破1.27亿,连续6年生育率第一, 广东“根本不用催生”

常住人口破1.27亿,连续6年生育率第一, 广东“根本不用催生”

肆时说
2024-12-04 15:49:33
她去世年仅49岁,三位上将扶灵,上万群众送行!省委为她代养儿子

她去世年仅49岁,三位上将扶灵,上万群众送行!省委为她代养儿子

历史丰碑
2024-12-04 11:22:42
2024-12-05 13:11:00
CSDN
CSDN
成就一亿技术人
25107文章数 241912关注度
往期回顾 全部

科技要闻

美国加大制裁之时 中国半导体出口破万亿

头条要闻

牛弹琴:尹锡悦政治生命已基本结束 可能比朴槿惠更惨

头条要闻

牛弹琴:尹锡悦政治生命已基本结束 可能比朴槿惠更惨

体育要闻

哈登,我不做大哥好多年

娱乐要闻

琼瑶尸检结果:一氧化碳中毒窒息而亡

财经要闻

代表青春的人人网,怎么“又”凉了?

汽车要闻

表现够全能 柴油版二代哈弗H9或许更适合家用

态度原创

旅游
艺术
家居
房产
公开课

旅游要闻

新一季冰雪旅游人数或超5亿!

艺术要闻

故宫珍藏的墨迹《十七帖》,比拓本更精良,这才是地道的魏晋写法

家居要闻

舒适优雅 打造从容舒适的居家氛围

房产要闻

4.61亿!天价成交背后,看「侨鑫现象」再定义“最好的房子”

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版