谷歌学术(Google Scholar)在2012年推出了一个杂志评价系统,即谷歌学术计量(Google Scholar Metrics),用来评价各个领域杂志的影响力。 该系统主要包括H指数(h-index或Hirsch index),H核心(h-core),H中值(h-median),H5指数(h5-index),H5核心(h5-core)和H5中值(h5-median)。
01
什么是H指数?
2005年美国加利福尼亚大学圣地亚哥分校物理学家乔治·希尔施首先提出这个概念,用以评价某一个学者的影响力,计算基于 论文总数 及被引频次,即某学者如果在其所有学术论文中至少有N篇论文分别被引用了至少N次,那么该学者的H指数就是N。 例如,某学者共发表200篇论文,其中有至少50篇被引用至少50次,那么他的H指数就是50。
02
什么是H5指数?
在谷歌学术计量系统,杂志的H指数指在所有发表的论文中有至少h篇论文分别被引用了至少h次,那么这份杂志的H指数就是h。 相应地,H5指数,H5核心和H5中值的计算基于那些收录在谷歌学术系统中的杂志最近 5年 的论文数量及各论文被引用的次数。
假设某期刊,2014-2018年共发表了5篇文章,截至目前为止分别在谷歌学术中被引了56次、23次、6次、3次和1次,我们发现有3篇文章被引了3次以上,而找不到4篇文章被引4次以上,因此该目前的H5因子就是3。另外还有期刊的H5核心集及H5中位数两个概念,H5核心集,借上面这个例子来说,指的是被引了3次以上的那三篇文章,H5中位数,指的是入选核心集文章的被引用次数的中位数,上述例子中,三篇H5核心文章的引用次数从大到小排列为56,23,6,故H5中位数为23。
谷歌学术计量报告虽然公布了H5指数,H5核心和H5中值,但最重要的还是H5指数。
需要指出的是,H5指数是对某杂志过去5年期间所发表的论文引用数进行的评价,例如,2015年对2010-2014期间所发表对论文引用数进行的评价。 但谷歌学术计量报告实际上只是对杂志前三年所发表论文的引用情况进行评估,因此可以说是对一个杂志的持久影响力进行评估。
同时, 只有那些在5年内发表了100篇以上论文并且至少有一个引用的杂志才会被收录到谷歌学术。
( )
03
H5指数和IF
个别杂志的影响因子很高,而H5指数相对偏低;有的杂志则相反,H5指数很高但影响因子却相对偏低;也有些杂志虽然影响因子不同,但是有相同的或相近的H5指数。
)
比如 PLoS ONE(IF=2.776) ,2019年最新的H5指数为176,这个指数相当高,在排名中达到23位!我们看看他近几年的发文量:
图片来源Web of Science
H5指数176代表,PLoS ONE近五年内(2014-2018)发表的11.8万多篇(118,438)论文中,有176篇(占0.15%)的单篇引用数超过176次。
排在其后一位的是 Nature Genetics(IF=25.455) ,H5指数为174,其发文量每年约190-200篇,几乎所有的文章都是高被引,其发文量如下:
从以上例子,我们不难发现,H5指数靠前的,基本上都是年发文量比较大的刊物。如果年发文量较少,就算篇均引用较高,也无法跻身H5前列。
比如影响因子第一的CA,在H5指数排名中,前100名都没进去!其原因还是:影响因子本质上是一个篇均引用次数,在总发文量不大的情况下,容易产生少量高引文章大幅拉高影响因子的情况,比如发表在CA的Cancer statistic数据,每篇引用次数都有好几千,而CA的总发文量不大,就说其它文章引用不高,其影响因子仍是最高的。而H5指数除了考虑每篇文章的引用次数外,还与期刊的总发表文章数量正相关。
由此可见,H5指数似乎更强调“大网捞鱼”,论文发表数量多的杂志非常占优势,不过像PLoS ONE这么大发文量的杂志还是不多见的!
04
1.谷歌学术H5指数查询是 免费的! 而影响因子IF查询需要购买账号。
2.H5指数对9种不同语言的出版物前一百名进行评估分析,因此有广泛代表性。
3.H5指数不受有超高引用单篇论文的影响,相对比较客观。
4.谷歌学术数据库收入范围非常广泛,不仅包括学术期刊,而且还收录书籍、会议、以及各种预印本。
04
1.主要评估杂志近五年内头三年所发表论文的引用情况。
2.偏重年发表论文量大的杂志。
3.由于不能查看谷歌的H5指数往年数据,所以不能进行年度横向对比。
4.谷歌学术指标数据库只提供了英文杂志各领域前20名杂志信息,其余中低档次杂志信息未知。
5.谷歌没有提供对各领域及学科分类的标准,也没有提供每个杂志所隶属的学科信息。
图片来源于网上
综上所述,谷歌学术指标具有一定的代表性和指导意义,但由于谷歌的学术指标才发布了四年,有些问题仍有待完善,比如杂志数据库收录的各项指标等,一旦修改就会影响全部数据。
从统计学角度上讲,H5指数是中位数,而影响因子是平均数,因为期刊的影响因子分布如果是非正态的话,H5毫无疑问是有优势的,但如果是正态分布的话,平均数便是不错的结果。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.