来源:节选自《用图表说话 麦肯锡商务沟通完全工具箱(珍藏版)》,清华大学出版社授权发布
不管我们在各类信息传达方式上见过多少种花样繁多的商业性图表——包括表格、组织结构图、流程图、矩阵以及地图——但是总的来说,只有5种基本形式:
现在知道了我们的目的是什么,要解决的问题是:我们怎样才能达到目的?借着下面的几个图表,让我来总结把数据变为简洁图表的过程。
第一步:决定你的信息
(从数据到信息)
选择合适图形的关键在于你,作为一个设计者,首先,你最重要的事就是明确想要表达的具体信息。
第二步:确定相对关系
(从信息到相对关系)
你决定的信息在一定程度上包含5种基本类别中的一种:成分、项目、时间序列、频率分布及相关性。
第三步:选择图表形式
(从相对关系到图表)
每一种相对关系都会相应引导出5种相对的图表形式。
现在我们详细地讨论每一个步骤。
# Shopping Guide
第1步:决定你的信息(从数据到信息)
在头脑中没有任何信息时去选择一个图表形式,就好像蒙起眼睛来识别房间的颜色。
选择使用什么样的图表完全取决于你想要明确表达的信息是什么。并不是数据——如美元、百分比、升或日元等——来决定的图表,也不是计量标准——如利润、投资回报或赔偿金等——来决定图表。更确切地说,应该由你所想要表达的主要信息来决定图表的形式。
为了强调第一个步骤的重要性,请你根据下面右上方方框中的数据(每个公司的区域销售业绩所占的百分比),在接下来的方框中画出你能想到的尽量多的草图。不必担心准确度的问题,你现在的目的是在翻到后面的答案之前画出尽量多的图表。
你看到的图表可能有的和你画的相同,甚至说你的图表可能更好。但是现在却有一个问题。
你应该选择哪一种图表?
这完全取决于你!完全取决于你想要表达的关键点——你的主要信息。展示出的每一个图表,只是数据简单的组织形式,但我们希望图表最好能强调它的信息。
例如,展示一组饼形图或者是百分比柱形图,那么你所强调的就是:
图1-1、图1-2显示了A公司和B公司的组合销售量不同。
或许你可以使用条形图来表明,按照表格中的顺序对它们进行排列。现在图表强调的是这么一个信息:
图1-3显示了公司A和公司B的销售额所占的百分比随着地域的不同而改变。
从另一方面讲,你也可以将每个公司中销售所占的百分比按照降序(或升序)排列,目的是强调下面的几点:
图1-4显示了A公司的销售额是南部最高,B公司的销售额是北部最高。或者说, A公司的销售额是北部最低,B公司是南部最低。
以区域为中线左右排列各公司的销售情况则表明了:
图1-5显示了A公司在南部的市场销售份额是最高的,然而B公司在南部却是最低的。
通过将条形图按组进行排列,我们现在来比较每个地区的差异。像这样:
图1-6显示了在南部地区,A公司与B公司相比在利润上以一个巨大的差额领先;在东部和西部地区,A和B势均力敌;在北部地区,A则明显落后于B。
现在,我们就可以确定你的信息是什么了,你也许需要绘制许多草图来帮你从各个方面观察各种数据。更加有效的办法则是突出最重要的数据,并且以之确定你的信息。
例如,看着下面这个简单的表格,数据反映的三个方面的信息可被选做重点,并被转换成主要信息的列表。
在图1-7中,你的注意力可能集中在1月至5月的总销售额变化趋势以及销售价格随时间变化的规律,那么你的信息就是“自1月以来销售额正在稳步提升”。
如果你的注意力集中于某一个单独的点上,比如集中在5月的数据上(如图1-8所示),你可能注意到了有关产品A、B和C的销售排名。如果那样的话,那么你的信息可以是:“在5月里,产品A的销售额大幅领先产品B和产品C。”
来看另一份同样是关于5月的数据表(如图1-9所示),你可能将你的注意力集中于每一种产品占销售总额的百分比上。那么你的信息可能是:“在5月,产品A的销售额所占的比例是公司所有产品中最大的。”
要注意最后两个例子,我们使用了相同的数据表却得到了完全不同的信息。强调销售份额还是强调排名是你决定的,而这个决定就是你要表达的信息。
假设你还有本公司的另一份数据。
图1-10中列表展示了在同一时间段也就是5月的销售额的大小。那么你的信息可能是:“5月大多数销售员的销售额都在1 000美元到2 000美元之间。”
这一组数据如图1-11所示,显示的是销售业绩与销售员工作经验之间的关系。只有两年销售经验的销售员P却有着23 000美元的销售业绩,然而销售员Q有着超过销售员P两倍的销售经验,其销售业绩却只有P的1/4,如此可以显示出这样一个信息:“销售业绩与销售员的经验之间没有必然的联系。”
就像我们看到的那样,在完成选择图表形式这一步骤之前,你必须完成决定你的信息这一步。在花费了很多时间与精力完成了这些之后,你就可以将你的信息设定为图表的标题。下面我将详细解释。
在我们看过的很多图表中,标题往往很神秘,比如:
公司销售额趋势变化
产品地域生产力分布
资产分配百分比
雇员年龄分布
薪水与利润的关系
这些标题描述的是图表的主题,但是它们没有说出与主题相关的要点是什么。 销售业绩怎么了? 职工的分布情况又如何? 薪水与利润之间的关系到底是什么呢? 不要把它当成一个秘密,而应该让你的主要信息成为图表的标题。 这样做就会减少读者误解你的意图的可能,而且能够确保他们将注意力集中于你想着重强调的那方面的数据。
让我们来看几个例子,它们能够证明将主要信息作为标题的优越性。
在图1-12中,标题陈述出了图的主题,然后让你来决定图所展示出的数据的重要意义是什么。研究这个图,大多数读者很有可能将注意力放在西部,认为这里信息强调的是“西部地区利润占公司总额近半”。
但是,那并不一定是设计者想让人们关注的关键点,他(她)想强调的也许是“北部收益份额最小”,简单地说,就是用了这种标题,你就很有可能被误解。如果用“北部收益份额最小”来取代原有的标题的话,就会减少读者将注意力集中在我们不想强调的方面的风险。
在第二个例子里(见图1-13),标题仅仅确认了趋势线代表的是订单的数量,它只是为帮助人们在一个报告或陈述中把这个折线图和其他折线图区分开来。然而对于研究趋势,有4个我们可能要注重强调的方面。
信息一,订单的数量在增长;
信息二,订单的数量在上下波动;
信息三,在8月,订单的数量到达了最高点;
信息四,在8个月份里,有两个月订单的数量下降。
为了帮助读者理解,我们选择要强调的信息作为图的标题。
信息的题目就好像报纸或是杂志的大字标题;它应该很简洁而且必须切中关键点。与我们刚才看到的隐晦的标题相比,它们所传达的信息也许是:
标题:公司销售额趋势变化
信息:公司销售额翻番
标题:产品的地域生产力分布
信息:C区域的产品生产力排第四位
标题:资产分配的百分比
信息:B预计分配到30%的资产
标题:雇员年龄的分布
信息:大多数雇员的年龄在35岁到45岁之间
标题:薪水与利润的关系
信息:薪水与利润之间没有关系
一旦决定了你的信息,你会发现这个过程变得非常具体。那就让我们继续第2个步骤,确定信息中隐含的相对关系。
第 2 步:确定相对关系(从数据到相对关系)
在制作图表的过程中,如果第1步从信息开始,而第3步我们将以图表结束的话,那么确定相对关系的过程就衔接在两个步骤之间。
这个认出主要信息的最重要的步骤,也就是从数据中分析出应强调的内容的一步,总是会将你引导至5种基本类型相对关系中的一种。这5种关系我分别称之为成分相对关系、项目相对关系、时间序列相对关系、频率分布相对关系以及相关性相对关系。
让我们来看看如何暗示出每一个相对关系的例子。让我定义一下相对关系并且给予你线索,也就是关键词, 从而识别出那些起源于数据的信息。
1. 成分相对关系
在一个成分相对关系里,我们的兴趣主要在于每一个部分所占的百分比。例如:
●5月,A产品预计将占到公司总销售额的最大份额。
●2005年客户的市场份额少于整个行业的10%。
●两项开销几乎占据了公司共有资金的一半。
如果你的信息包括这些词汇:“份额”、“百分比”以及“预计将达到百分之多少”,那么你的图表肯定就是一个成分相对关系图表了。
2. 项目相对关系
在项目相对关系里,我们想要比较事物的排列方法。
它们是差不多,还是一个比另一个更多或更少?比如:
●5月,A产品的销售额相当于B、C销售额之和。
●销售额中顾客的回报排名第四。
●6个部门的营业额大致相当。
“大于”、“小于”或者“大致相当”都是项目相对关系中的关键词。
3. 时间序列相对关系
这是我们最熟悉的一种相对关系。我们对每一个部分所占的比例或者是它们怎么排列不感兴趣,而对它们怎么随着时间变化感兴趣:它们每星期、每月、每季度和每年的变化趋势是增长的、减少的、上下波动的或者是基本保持不变。例如:
●自从1月以来销售额稳定增长。
●投资回报在过去的5年里急剧下跌。
●利率在过去的7个季度里起伏不定。
你的信息里的词语包括“变化”“增长”“提高”“下降”“减少”“下跌”和“上下波动”。
4. 频率分布相对关系
这种相对关系显示的是,各数值范围内各包含了多少个项目。例如,我们用一个频率分布来表明有多少员工的薪水少于,比如说,30 000美元,又有多少人的薪水在30 000美元到60 000美元之间,等等;或者是小于10岁的人口有多少,10岁到20岁之间有多少,20岁到30岁之间又有多少,等等。典型的信息可能为:
●在5月,大多数地区的销售额在1 000美元到2 000美元之间。
●大多数的出货要5到6天的时间交付。
●我们公司员工的年龄分布与我们的竞争对手相比有很大的不同。
这一类相对关系的有关术语有:“从X到Y”、“集中”、“频率”与“分布”等。
5. 相关性相对关系
相关性相对关系显示的是两个变量的关系是否符合你所要证明的模式。例如,你可能预期利润和销售额同比增长,你也会预期销售额随着折扣幅度的增长而增长。
当你的信息包括“与……有关”、“随……而增长”、“随……而下降”、“随……而改变”、“随……而不同”等,或者反过来说,比如“不随……而增长”等,那么可以肯定你所展示的是一个相关性相对关系,例如:
●5月销售业绩显示出销售业绩与销售员的经验没有联系。
●首席执行官(CEO)的薪水并不随着公司规模的变化而改变。
●订单的大小与客户的收入成正比。
这样一来,我们就知道了信息中包含的5种关系,简单地归纳如下:
●成分:占总体的百分比。
●项目:项目的排名。
●时间序列:如何随着时间变化。
●频率分布:项目的分布情况。
●相对性:变量之间的关系。
头脑中有了这些印象,再加上手中的一支铅笔,你就可以研究下面的12种典型的从列表中得到的信息了。如果必要的话,你可以寻找线索,回顾刚才我们所讨论的例子,然后与后面的答案对照。
1. 预计在今后10年多的时间里销售额将增长。
2. 雇员的最高工资额在30 000美元到35 000美元之间。
3. 汽油并不是牌子越响价格越高其性能就越好。
4. 6个区域在9月的营业额大致相同。
5. 销售部经理在他的领域内只花费了他15%的时间。
6. 奖金的多少与工龄长短无关。
7. 去年,人员更替主要发生在30~35岁的年龄段。
8. C区域的产品生产力排名垫底。
9. 我们公司的平均收入份额正在下降。
10. 制造业占有资金的最大份额。
11. 利润率与工资之间有一定的关系。
12. 两种产品在8月的产值远远超过另外6种产品。
答 案
1. 时间序列 5. 成分 9. 时间序列
2. 频率分布 6. 相关性 10. 成分
3. 相关性 7. 频率分布 11. 相关性
4. 项目 8. 项目 12. 项目
通过对于从数据到信息,以及从信息到相对关系的理解,我们现在已经准备好了进入最后一个步骤——从相对关系到选择最适合你的信息的图表形式。
第三步:选择图表形式(从相对关系到图表)
如上所述,不管你的信息是什么,5种图表中总有一种是适合你的。这应该是毫无疑问的,不管你的相对关系是什么,它总会将你引至5种基本图形中的一种:饼图、条形图、柱形图、折线图和散点图。
我发现饼图是最受欢迎的图表形式。但实际上它并不应该这样受欢迎,因为它是最少使用的一种图表,在所有的陈述和报告中其使用率应少于5%。
从另一方面说,条形图是最不受赏识的一种图表。而其实它应该受到更多的关注,因为它是最通用的一种图表,应该在所有的图表使用中占到25%。
我通常将柱形图比喻为“老好人”,把折线图比喻为“苦力工”,它们在所有的图表使用中占到一半。
而散点图的使用乍看之下有些不可思议,其使用率为10%。
上述图表的使用率总计为90%,其他的剩余部分为图表的综合使用。我应该提醒你的是这些图表可以联合使用——比如说,折线图和柱形图联合或者是饼图和条形图联合。
每一种图表形式,都对应一种适合用来描述的相对关系。
下面这个矩阵解释的是初步选择,下面有5种基本的图表形式,顶端写着的则是5种我们刚刚讨论过的相对关系。对于时间序列和频率分布来说,如果只有很少的(大概六七个)数据点,那么就使用柱形图;如果你有很多数据的话,可使用折线图。在一个相关性相对关系中,使用一个条形图只能显示非常少的数据,可是使用散点图却能显示很多。
下面通过观察矩阵接着研究我们的问题,看看为什么某种相对关系要对应使用某种图表形式。在这个过程中,我们将讨论大多数图表制作方法以及怎样根据附加的数据进行相应的变化。
特别提醒大家记住一点,选择图表,尤其是使用图表,不是一门绝对精准的科学。所以你应该注意使用你的限制性的词语,如,多使用诸如“一般地”、“恰巧地”、“大多数情况下”或“少数情况下”等这些词语。所有这些词语的使用说明你必须根据自己的判断来决定图表形式。这些在你的矩阵中被陈述的图表选项,以及我们对你制作大多数图表的建议,只是一个基本原则。但你会发现这些原则会给你提供很大的帮助。
接下来我们将讨论每一种相对关系以及它们所适用的图表形式,现在,我建议你先跳到第2章看看,在那里,我介绍了几个很具有代表性的范例。浏览这些设计合理的图表你就能知道用好的构思设计的图表是多么有效。
1、成分相对关系
成分相对关系最好使用饼图。因为一个饼形能够给你一种整体的形象,如果你的目的是展示每一部分所占全部的百分比,例如,在展示组成行业的各个公司时(见图1-14),饼图就是你的唯一选择。
为了使饼图尽量发挥作用,在使用中不宜多于6种成分。如果你使用的成分超过了6种,那么就选择6种最重要的,并将未选中的列为“其他”的范畴。
因为人的眼睛比较习惯于按顺时针方向进行观察,所以应该将最重要的部分放在紧靠12点钟的位置,并且使用强烈的颜色对比以显示突出(例如在黑色背景下使用黄色),或者在黑白图表中使用最强烈的阴影效果。如果没有哪一个部分比其他部分更加重要,那么就应该考虑让它们以从大到小的顺序排列,并且以同一种颜色或者干脆不使用阴影来绘制图表的每一个部分。
总之,饼图是5种图表形式中最少使用的一种。但同时也是最有可能被滥用的,或者说是乱用的。
例如,在下一页中我提供了几种多年来,我在各种各样商业陈述、报纸、杂志和年度报告中发现的使用得非常荒谬的饼图。我也承认这些例子非常具有想象力而且很吸引人,并且图的元素丰富,只是例子D稍有些恐怖。但它们却体现了“形式比内容更加重要”这种错误的典型例子,因为它们并没有展示出一个精准的视觉效果,所以只是图表制作得比较好看而已,徒具其表。
让我再强调一遍,我们最初使用图的目的是使阐明关系的过程比使用列表更快捷更清晰。当图的形式比内容更加突出——就是说当图表的设计干预了听众或者读者对内容的掌握时,就会影响他们做出正确的判断。
让我们放松一下,做一个练习,检测图表作为辅助材料是否有效。为了使这个过程更加准确,你必须承诺按第一直觉作答;记录下你的第一视觉印象。在每一个例子中,从上部开始,然后逐步往下看,并快速填写出每一个部分所占整体的百分比,然后将每一部分加到整体上。最重要的,你不能往回看,也不能修改,而且你也不能改变主意,因为在这个过程中你没有时间去思考。
在下面的6张图中,把每一个部分所占的百分比填上去并把它们加起来。
现在,将你的估算与实际数据比较一下吧!
如果你的结果与这些数据差异巨大——至少在图A至图E中——那么就可以肯定图没有发挥我们想要它发挥出的作用。我给我的很多同事做过这个测试,你的结果与他们的应该会很相似,很少有最后加起来正好是100%的。加起来少于100%的和多于100%的结果一样多。在最极端的例子中,有些数据加起来少的不足45%,多的甚至有超过280%的。即使有人得到了相同的结果,他们每一个部分的比例也不尽相同。
然而另一方面,几乎所有人都能够准确地估算出例子F中每个部分所占的百分比,即纳税所占比例。它使用了一个传统的饼图。在这个图中,人们可以很清楚地看出a部分占整体大概为5%左右,b大概为25%左右,e部分大概比50%多一点。然而实际上,图F是基于同图A同样的数据绘制的。我只不过是改变了一下标题,看看会产生什么效果。比较一下你填在图A上的数据以及填在图F上的数据,然后记录一下由于图形式的不同造成的差别有多大。
在这个练习中你应该得到这样一个启示:如果你的目的是表达精确的对比关系,那么请克服你强烈的创造欲望,并且使用传统的饼图。或者将你的创造力充分利用在版面设计上,以及字体、背景颜色的选择上。
一个饼图比一个100%的条形图或100%的柱形图优越的地方,在于它能够清晰地展示一个整体。但是,一旦你需要比较两个或两个以上整体的内容时,不要犹豫,马上选择100%的条形图或者是100%的柱形图。下面的例子道出了个中原因(见图1-15)。
注意观察图注,在两个饼图中使用时,必须重复显示。当然,我们可以使用符号注释。但是这种做法会强迫你的读者前后反复对比来看,以明白到底图中的哪一部分对应于哪一部分。同样,尽管阴影或颜色能帮助读者区分这三种成分,但他们的视线必须从一个图到另一个图前后移动不断对比,才能掌握它们之间的关系。
通过使用两个100%的柱形图,我们就减少了很多麻烦。现在图注只需出现一次,对比性也增强了,在这里,我们使用了连接线加强了它们之间的联系,使其在外观上更加明显。
2. 项目相对关系
项目相对关系可以用条形图来表示。纵向维度并没有刻度值,它们使用的都是标示过的项目——例如国家、产业和销售员的名字等。按照你想强调的方式可以把条形图排列成任何顺序。例如在对一个公司与5个竞争对手的销售业绩进行比较时,条形图的顺序可以是公司名字的字母排列顺序,或者是进入本产业的时间先后顺序,或者是销售的规模大小顺序,再或者是回报数量的高低顺序。这个例子就是按客户回报率从高到低(或者从最好到最坏)的顺序排列的(如图1-16所示)。
图1-16条形图
在准备条形图的过程中,要做到保持条形图之间的距离比条的宽度小。使用最能形成对比的颜色及阴影来强调重要的项目,以此来强调信息的标题。
为了突显数值,可在顶端(或者在底端)使用一个刻度尺,或者在条形末尾标注数字,但是注意不要两者同时使用。如果你只是想简单标示项目间的关联,可用刻度尺;如果数字对你很重要,就使用数字。有时,使用刻度尺的同时标示一个需要特殊强调的数值,也是个好办法。但同时使用刻度与数字,那是毫无用处的,而且还只能给你的条形图增加混乱,这时你就应该使用柱形图和折线图来避免麻烦。
展现这些数字的时候,应该注意将小数点以后的数字省略,因为它们对你的信息几乎没有影响;12%明显要比12.3%或12.347%更容易被听众记住。
为了表现条形图的多样性,这里我提供了6种形式各异的图表形式,每一种都提供了附加的信息。怎样利用这些各有特色的图表,在这一节的下一个部分中就有图解说明,也许你现在就想看一看,你一定想将它们添加到你的图表储藏库中。
有时,你可能想用柱形图来代替条形图,用垂直的条形图来代替水平的以表明一个项目的相对关系。其实这样做并没有什么错。但是,在占90%的大多数情况中,有两个原因你不应该使用柱形图。第一,通过使用条形图可以减少把项目的对比关系误解为时间序列相对关系的可能,使用柱形图则更适合表现时间序列相对关系。为了增强区分感,我们尽量减少使用条形图展示随着时间的变化关系。在西方文化传统中,我们更习惯于使用时间从左到右的顺序,而不是从上到下的顺序。
第二个原因是比较实际的。通常,项目都有着冗长的图注,例如版图上的东北、西南,产业上的农业、制造业,销售员的姓名等,都需要很多的空间。注意两个例子你就可以看到(如图1-17所示),左边的条形图留有很多的空间可以写名称,而在右边的柱形统计表则不然,它经常会出现一个词写在两行的情况,因而增加了观察者识别的困难。
3. 时间序列相对关系
成分相对关系和项目相对关系能展示在同一时间点上的相互关系。而时间序列相对关系则能够展示出随着时间变化而变化的关系。
最好的阐释时间序列相对关系的方式就是使用柱形图或折线图,选择使用哪一种,这取决于用哪一个比较方便。如果你的图表中只有少数的几个点(比如,7到8个),那么就使用柱形图;反之,如果你必须在图中展示20多年来每个季度的变化趋势,你最好使用折线图。
在柱形图与折线图的选择过程中,你也可以考虑一下数据的本质。柱形图强调的是数量的级别,它更适合于表现在一小段时间里发生的事件,产量的数据很适合这个领域。折线图强调的是角度的运动及图像的变换,因此展示数据的发展趋势时最好使用它,存货量就是一个很好的例子。
除了这些差别,每一个图表形式都有着其自身的特点及多变性,让我们来分别研究一下(如图1-18所示)。
关于充分利用条形图的建议也同样适用于柱形图。要尽量使柱形图之间的距离小于柱形图的宽度,要使用颜色及阴影以示强调、区分与时间有关的数据。
就如条形图,还有几种柱形图的变体也是有效工具,第2章将展示其多样性(如图1-19所示)。
折线图
毫无疑问,折线图(见图1-20)是5种图里使用次数最多的一种,而且也最容易绘制,最简洁紧凑,最能清楚地表现上升、下降、波动和保持不变等趋势。
当准备一张折线图时,要确保趋势线一定要比基线画得更粗,而且基线比坐标线要粗。
想象一下, 你要负责一场体育比赛的裁判工作,就可能要使用成绩参考图。为了帮助观察者方便查阅,你会使用垂直的坐标线来表示历史上的比赛成绩以及预计未来的成绩增长,或者说是强调某一段时间的增长。你也可能绘制一些水平线来帮助观察者看清楚参考值。总而言之,这些事情要你自己来决定。
折线图的变体只有两种类别,远远少于条形图及柱形图,但是它们的重要性却很值得进行更多的讨论。
分组折线图可以用来对两个及两个以上项目相对关系作比较。为了把你们公司与竞争对手区分开,在趋势对比图中,代表你的公司的那一项上使用能产生强烈对比的颜色及最粗的实线,对其他公司则使用对比程度上稍微次一点的颜色和虚线。
问题的关键是我们在图表中可以用多少条趋势线而不至于使其看上去像是意大利面条(见图1-21)。那就让我们现实一点,有8条趋势线的图表对于有4条趋势线的图表来说,并不具有两倍的有效性,相反却很有可能产生两倍的混乱。
解决这种混乱的方法就是针对每一个竞争对手趋势图分别配对,并制成一个较小的图表(见图1-22)。我承认,这样会使图表的数量大大增加,但与原来的相比,每一张图表还是简洁多了。
通过在趋势线及基线之间添加颜色或者阴影,我们制作出了表面图。将表面细分我们就得到了表面细分图,就像细分的条形层及柱形图那样,它将表面数减少至5面或更少。如果超过5个表面的内容的话,那么就选择4个最重要的,并将剩下的列为“其他”范畴。
在所有细分的图表当中,将最重要的部分放在紧靠基线的地方,因为这是唯一一个从直线开始测量的图形,其他部分则以此为基础增加或减少(如图1-23所示)。
和应对那个意大利面条式的图表一样,搞清各个层表面关系的方法就是把它分解成一个个独立的部分,将一个细分的图表简化至单一的表面图(如图1-24所示)。
4. 频率分布相对关系
一个频率分布相对关系展示的是有多少项目(频率)会落入一个具有一定特征的数据段当中(分布)。
这种类型的相对关系有两种主要的应用,第一种是在所有样本中进行归纳。在这里,频率分布相对关系是用来预测风险、可能性或者机会的。一种用途显示货物在5天以内交付的可能性为25%;另一种描述确定性(不确定性),比如说,在掷骰子游戏中,在所有的可能性中猜七点的概率(可能性只是1/6),如图1-25所示。
这个“钟形”曲线及频率多边形的运用是依据数学原理制定的。请你根据统计学来设计它们。既然这些曲线只是为了分析的目的做初级使用,所以在这本书中就不做过多考虑了。
第二个应用,在商业陈述及报告中经常被用到,就是总结大量的数据来帮助证明一些有意义的关系(例如,25%的货物将会在5到6天内交付)。这个应用在人口统计学上相当常见,例如通过工资水平来统计各层次雇员的数量(如图1-26所示),或者通过收入水平来给美国家庭分类,或者通过年龄段来划分投票方式。这种频率分布图表的使用相当普遍,频率分布图表在年度的人口普查及每四年举行一次的总统选举中都会用到。
柱形图(频率分布柱形图)
在这里,最能诠释频率分布图表的是阶梯式柱形图或折线图,当只使用几行数据,例如5~7个数据时,柱形图要好一些,而当数量很多时最好使用折线图(如图1-27所示)。
这种图表有两个维度:垂直的是项目或事件的(频率)数据(有时是百分比),水平的是各个范围内的分布情况。而对后者我们尤其需要注意。
范围的大小。范围的大小以及各组的数量在引导出分布模式时是很重要的,组数太少则不够明显,太多则会破坏其作用。总的来说,数量应不少于5组并不多于20组。只要在这个范围内,不管怎样都能够找到一定的组数证明你所要论证的信息。例如,如果我们想要设计在50个州中每个公立学校教师的年收入分布图的话,可看下图:
以500美元为一个增长点绘制,
模式不是很明显(如图1-28所示)。
以1 000美元为一个增长点绘制的图表,模式有些清晰了(如图1-29所示)。
但是只有以2 000美元为一个增长点的图表才能看到与频率分布图表结合的最佳形状曲线(如图1-30所示)。在这个例子里,曲线向左倾斜,也就是说,向更低的数据倾斜,预示着一个可能的信息,几乎半数州(50个中的23个),教师的年薪低于26 000美元。
分组的大小。最好使用规模大致相同的组,如果一个分组的范围是5美元,而另一个是20美元,那么这个分布图的整体形象就会被打乱。但当数据不是平均按段记录的时候,就会出现例外(例如,教育水平)。再如有时不均等的分布会给人以更好的感觉,例如个人收入的税级。由于收入的范围很广而且低收入的人群远远要比高收入的人群数量多,采用相等的间隔并不起作用;以1 000美元为划分标准列出的图表会有好几米长,而40 000美元则几乎把所有人都放在了第一个区间内。如果低收入部分间隔小一些而高收入的间隔大一些,图表看上去就很明了。
清晰地标注。对组的规模应该予以清晰的解释。“重叠的”标注,例如0~10,10~20,20~30,并不能说明哪些组有重复的数据。在连续的数据中,例如以美元计算的销售额,首选的便是小于10.00美元,然后是10.00~19.99美元,20.00~29.99美元,等等。在离散的数据中,例如生产的汽车数量,最好的分组方法应该是10,10~19,20~29,等等。
频率分布柱形图与频率分布折线图都可以分组表明,例如,按照年份的分布图,或是与你竞争对手雇员的平均年龄分布相比。同样,当需要使用绝对数值时,它们就能够使用细分以表明每一个竞争对手的情况(如图)。①
① 注意:当频率分布图强调的是百分比时,将频率分布图再细分就会产生误导。例如,如果60%的妇女每小时挣5~10美元,而且这与50%的男人的收入数据相同,则不能说成是110%的人每小时挣5~10美元。
5. 相关性相对关系
一个相关性相对关系显示的是两种变量符合或者是不符合你所希望出现的模版。例如,你认为具有较多经验的销售员会比经验较少的销售员业绩要好,或者你会认为学历较高的雇员会有较高的底薪。此类的比较最好使用散点图,散点图有时称为点状图。或者我们可以使用一个成对条形图。下面让我们逐个进行分析。
在图1-31中我们展示了依据16种不同折扣对应的销售数量。通常情况下,也许你会以为折扣越多,购买的动机就越大。但正如这个散点图所显示的那样,它们之间并没有直接的联系。
散点图
例如,研究标注为A和B的两个圆点,展现出了两个销售员的不同做法。他们都卖出了20个单位的数量(水平维度)。不管怎样,A提供了7美元的折扣,然而B只提供了4美元的折扣(垂直维度刻度)。从另一方面说,销售员C和D都只提供了3美元的折扣,而销售员C售出了30件产品,然而D的销量却比C高出两倍。很明显,折扣的数额与销量之间并没有很明显的关系。
如果存在相关性的话,图上的点应该分布在从图表的左下角到右上角的对角线附近,在这里用一个箭头来表示这条斜线。通过这一箭头来表示预期模式会有很好的效果。当然,有些时候,箭头也有可能由上到下。例如,在价格下降的同时销售量增长。还有,不要把箭形图与数学上的“最佳拟合线”相互混淆,散点图曲线强调的是图形的价值。
这种散点图越来越多地在演示、报告和一些商业杂志中使用。如果你打算使用的话,那么在展开你的观点之前,要耐心地向你的听众们解释如何来理解。
使用散点图除了显得很混乱以外,麻烦之处还在于如何识别这些图表中的圆点。将每个销售员的名字写在代表他们的点的旁边,这样不仅会给制表带来麻烦,还会让观察者看不清楚。一种解决方案就是使用图注——将每个人的全名用数字与字母展示,而把名字写在图表以外的地方。另一种更好的选择便是使用成对条形图(见图1-32)。
换句话说,就是低的折扣会映射低的销售额,而很高的折扣则会映射高的销售额。如果这个关系并不符合我们预期的模式,那么两对条形图就会互相偏离,就像在这个例子中显示的那样。
这个成对条形图方案只在数据组较少时才会起作用。如果数据超过了15组甚至更多,那么你最好不要再标记出每个点,应该换为使用一个更加紧密的散点图。
虽然成对条形图没有什么变体,
但散点图却有几种变体应该说一说。
这个分组散点图显示的是两种项目的相对关系及一种项目在两个不同时期的相对关系。尽管在这里,我们同时使用了实心及空心的散点图,其实我们同样也可以使用其他合适的符号,例如正方形、三角形或者星形。
第三种是许多半径不一的圆所形成的泡泡图。举个例子,维度分别表示销售额和利润时,就可用圆点半径大小表示行业中各个公司的规模。
时间散点图展示的是随着时间而改变的相对关系。记住不要把这些变化都放在一个图表中,应该把它们放入自己的图表当中来证明(如图1-33所示)。
以上是所有变体的综合应用。
提醒你一句话:要注意尽量简化散点图,以免将它们画成米老鼠或者是星球大战(如图1-34所示)。
以上就是反映在你的信息中的5种基本相对关系,以及最适合表现它们的图表形式。
为了保证你能够在实际案例中运用它们,可以在以下的两个练习(练习A和练习B)中检验一下你自己。接下来,学习第2章的内容,并且学以致用。
近期中标信息:
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.