数据也会说谎:隐藏在统计数据中的那些小把戏

2018-11-04 12:40:34 来源:网络整理 作者:管理员

原标题:数据也会说谎:隐藏在统计数据中的那些小把戏

文|邻章

“世界上有三种谎言:谎言、弥天大谎和统计数据!”——美国统计专家达莱尔·哈夫在其传世之作《统计数据会说谎》中如是说。对于统计数据,我们似乎对其有着某种天然的信任感,认为其代表着客观公正,数据不会说谎乃至成为了我们的潜意识,在许多时候成为了我们评判事物好坏与否的标准。但现实的悖论在于,许多聪明的人或机构就是抓住了我们对于数据的这种天然的信任感做起了文章,通过各种统计手段得出各种或好或坏的各种数据,进而影响普通消费者的判断。

数据也会说谎:隐藏在统计数据中的那些小把戏

的确,在日常生活中,我们时常也能看到,在那些竞争激烈的行业,不同的统计机构往往会在同一时间给出相互打架的数据结论,造就同一行业中同时出现多个第一的闹剧,这在过往的外卖、移动支付、共享单车、智能手机等市场中都已是屡见不鲜。但常识告诉我们,同一行业中同时出现两个第一,是概率极小乃至是不可能事件。

为何这种统计闹剧屡见不鲜?

其中原因多种多样,往小了说有统计口径差异,基数偏差、数据粉饰、夸大等等,而往大了说那么就有可能是故意为之的数据造假,以求达到不可告人的目的。诚如政治家格罗夫纳(C.H.Grosvenor)所言:“数据本身不会说谎,但说谎者需要数据。”

所以对于我们而言,在以统计数据作为决策依据时,需要擦亮自己的眼睛,预防辨别出统计数据中时常出现的一些小把戏,选择具备真正有意义的统计数据来做参考。

一、采用不同统计口径的统计数据

不同统计口径造就的数据差异,往往在市场份额、销量这类统计中时常出现,表现得颇为明显。诸如在过往的国产厂商在国内智能手机市场销量谁是第一的竞争中,甲乙两家厂商都宣称自己是当年的市场销量第一,并且拉出了不同的市场调研机构给出的结论来站台背书。

的确,从不同统计机构给出的数据来说,这两家都做到了各自的第一。但问题的有趣之处在于甲乙两家厂商拉出来给自站台背书的统计机构所采用的统计口径却不尽相同,有的采用的是Sell-in(生产商卖给零售商的商品数量)的统计口径,有的采用的则是Sell-out(零售商卖给顾客的商品数量)的统计口径。

而从实际意义或者价值来说,或许把东西销售到用户手中的统计会更具价值。而这种由于统计口径造成的结果差异或者是数据打架现象,不仅在智能手机市场的销量统计中存在,在其他许多行业也同样存在。

二、忽略规模基数的统计数据

在日常生活中我们更为容易遇到、也更容易误导我们的一种统计小把戏是忽略规模基数差异的统计数据。

诸如在许多行业中,用户会把平台的顾客投诉量作为一个重要考察指标,也或正因如此,一些机构也做起了聚合用户各类投诉而后发布不同行业用户投诉排行榜的事情。但有时候观察这些机构发布的这类投诉数据排行榜,我们却能发现他们发布的这类投诉排行榜其实对于用户的决策而言,并不能带来有任何实际意义的参考价值,反而有可能会把用户带进坑里。原因在于这种投诉量排行榜忽略了一个统计中最为基本的要素——用户基数差异。

显而易见的一个道理是:不同行业不同品牌、平台,其用户规模各不相同,有的平台用户规模可能会很大,而有的平台用户规模则很小。但在众口难调的现实下,显然用户规模更大的平台,往往就会在这类数量的统计中更为吃亏。

但从实际的整体概率来说,我们却能发现用户规模高的平台,其服务水准、用户满意度、平台安全性可能反而会更高。所以从这个层面来说,如果要真的去考量一个品牌、平台的服务水平、产品质量,其实更为合理负责的统计方式不是去统计他的用户投诉量,而应该是计算用户的投诉率。

诸如在去年21CN聚投诉发布的2017年十大行业“金虾奖”这份榜单中,我们就能明显发现采用用户投诉量的统计方式所带来的用户误导。在这份榜单中,淘宝、天猫、微信支付、支付宝、苹果、海信、玖富等不同行业的领导品牌均登上了这份黑榜。但这份忽略平台用户规模基数差异的榜单,其实并不具备任何说服力。

数据也会说谎:隐藏在统计数据中的那些小把戏

以淘宝、天猫的数据为例,我们看到在聚投诉平台这份“金虾奖”榜单中,用户投诉量是5707件。这个数据初看之下给人传递的感觉是投诉量的确还是蛮多的,但若是考虑到淘宝天猫累计超6亿的用户规模,那么以此投诉量计算投诉率,可以得出实际上淘宝天猫的用户投诉率仅为0.00000951%。而不仅是淘宝天猫如此,在当时这份榜单上的许多品牌都是如此。

而事实上,这类忽略用户规模而只谈数据的统计案例还有很多。诸如在科技互联网行业中大家最为关注的某些增长率上,往往就会如此。

还是以平台用户最为熟悉的智能手机产业为例,我们时常看到,苹果三星的销量增长仅为百分之几,与动辄销量增长达到20%乃至30%的国产相比,自然是自惭形秽,许多厂商也会以自己的增速超过苹果、三星而大加宣传。

虽然他们的销量增速放缓是客观存在,但在描述这在客观存在时,我们更需要注意的是要以他们现有的销量基数大小为参考,而若忽略体量谈增速,其实是非常不客观的,毕竟从现实来说,体量越小其实就越能取得高增速。当你销量为几百万台时,取得一个30%的销量增速可能会很容易,而若是当达到了诸如三星的每个季度7000—8000万台左右的销量时,要30%的销量增速就会极为困难了。

三、图表扩大化造就视觉误差

在统计口径、用户规模存在差异的统计带给用户困扰之外,其实还有另外一种统计手法容易给用户带来困扰与误导——图表扩大化造就的视觉误差。其原理在于:相对于文字而言,人类对于视觉信息有着更快的接受速度也更容易产生深度记忆。而许多“聪明”的公司,就做起了图表的视觉误差的文章,这在视觉误差在对比图中尤为常见。

数据也会说谎:隐藏在统计数据中的那些小把戏

诸如在今年华为GUP Turbo这项”吓人技术“发布的时候,其在与竞品们比较游戏时长时,我们就能看到在华为给出的这张对比图中,虽然荣耀Play在游戏时长上比iPhone X只多了半个小时,但是在上面这张对比图中,我们一眼看去留下的印象是:荣耀Play的游戏时长超越iPhone X一倍不止。如果仅给iPhone X标注4.0小时而不给荣耀Play标注4.5小时,把这在图放出去让用户猜测荣耀Play的游戏时长,信息我们心中想到的数据绝不会是4.5小时,而会是拥有至少十个小时的游戏时长。

写在最后:

毋庸置疑,统计数据对于我们的各类决策,有着重要的参考意义,但他的前提条件是我们寻找参照的统计数据要有意义,不能存在一些统计污染在其中。但在现实中,许多统计机构却在真实与谎言的灰色地带上走钢丝,使得诸多统计数据开始变得不仅不具备参考意义,反而会把用户带进沟里。

在此,需要的是我们擦亮眼睛,学会识破统计数据中的一些常见小把戏。当然,更需要注意的是,上述几种只是最为常见与简单的统计小把戏,在更低的统计中,还有更多高深的把戏,这需要我们以更为专业的知识去识破他们。

注:本文所有图片源自网络。

文|邻章【微信号:ZLxgic,微信公众号:TMT317】欢迎添加关注!文章转载请注明出处。

本人系独立撰稿人,腾讯科技2016年年度新媒体,关注智能手机、移动互联网、人工智能等,文章在虎嗅、钛媒体、界面新闻、百家号、搜狐科技、腾讯、雪球、品途商业评论、今日头条等30余家平台发布。

显示全文
为您推荐
钱姓起源和来历:活了八百岁的彭祖竟然是钱氏祖先
钱姓起源和来历:活了八百岁的彭祖竟然是钱氏祖先

钱姓排于百家姓中的第二位,虽然起源和来历并不多,但是钱姓人却分布广泛,成为了中国姓氏中的第二大姓。钱姓的主要来源就是彭祖的儿子篯孚,彭祖的真名叫做篯铿,是因为被尧封于大彭而得姓-彭,而他的儿子篯孚因为掌管着钱财,任职钱府上士,所以便为“钱”姓,所以彭钱是一家。...

发布时间:2024-09-20 20:03:27

胡服最早由谁引入中原?赵武灵王为推行骑射改革服饰
胡服最早由谁引入中原?赵武灵王为推行骑射改革服饰

胡服最早是由春秋战国时的赵武灵王-赵雍引入中原的,因为当时赵国的地形和地理位置都非常不好,常年深受战争威胁,加上赵武灵王继位之后,时局不稳,周边国家都想要攻打赵国,所以赵武灵王便下令让全员都推行胡服,并且学习骑射,相较于宽大的汉服更加便于行动。...

发布时间:2024-09-20 19:05:44

赛艇运动起源于哪里?英国船工无聊时竞赛(造就贵族运动)
赛艇运动起源于哪里?英国船工无聊时竞赛(造就贵族运动)

赛艇运动起源于英国的泰晤士河上,当时还是17世纪,英国泰晤士河上的船工在工作之余经常会举办一些赛船,久而久之就形成了一种习俗,在1715年的时候,为了庆祝英王的卫冕,所以第一次正式举办了赛艇比赛,最终在1775年发展为一个正式的运动项目,并且成立了相应的运动俱乐部。...

发布时间:2024-09-20 18:04:28

为什么不能用宸字取名?哪些名字普通人扛不起
为什么不能用宸字取名?哪些名字普通人扛不起

人们之所以不愿意或者不敢以“宸”为名,主要是因为在古时候“宸”有着“深邃的房屋”的意思,也就是专指皇帝的居住场所,象征着无上的权力,所以“宸”字自然也就成为了禁忌,不过现代人大多是害怕这个字的气势,普通人的命格扛不住。...

发布时间:2024-09-20 17:00:53

商细蕊原型是谁?原来四位京剧名旦都是灵感来源
商细蕊原型是谁?原来四位京剧名旦都是灵感来源

商细蕊是电视剧《鬓边不是海棠红》中的京剧名旦,很多人都为他和海归商人程凤台的知己故事而动容,但遗憾的是在历史长河中并没有商细蕊真正的原型,只能说他可能是作者根据历史上著名的京剧名旦构建的一个角色,因为他和梅兰芳、程砚秋、尚小云以及徐碧云等四人的经历和性格都有着极为相似之处。...

发布时间:2024-09-20 16:05:01

历史上著名的美女有哪些:杨玉环,君王不早朝(绝世美女)
历史上著名的美女有哪些:杨玉环,君王不早朝(绝世美女)

在中华上下五千年的历史长河中,除了王朝更替的政治生活与文化生活,还有一些美貌的女子点缀着历史的绘卷,那么在悠悠岁月中有哪些著名的美女呢?下面小编就来为大家盘点一下吧!...

发布时间:2024-09-20 15:04:04

历史上妃嫔最少的皇帝:明孝宗朱佑樘,独爱张皇后(童年不幸)
历史上妃嫔最少的皇帝:明孝宗朱佑樘,独爱张皇后(童年不幸)

谈及古代帝王,最让人津津乐道的当属那后宫佳丽三千,不过也不是所有的帝王都有那么充实的后宫,比如历史上有一位皇帝就只有一位妻子,是不是让人有点不敢相信,下面小编就带大家一起了解下吧!...

发布时间:2024-09-20 14:01:05

历史上最长情的皇帝:顺治皇帝,挚爱董鄂妃(为爱出家)
历史上最长情的皇帝:顺治皇帝,挚爱董鄂妃(为爱出家)

自古无情帝王家,说到帝王的爱情多是奢望,很多帝王后宫的妃子换了一个又一个,几乎都是薄情寡义的,但是漫长的历史长河中也有例外,有的皇帝便与众不同,特别的长情,下面小编来为大家介绍一下历史上最长情的皇帝吧!...

发布时间:2024-09-20 13:03:24

武侠剧中的绝世高手有哪些:扫地僧,化险为夷(秒杀高手)
武侠剧中的绝世高手有哪些:扫地僧,化险为夷(秒杀高手)

可以说人的成长伴随着无数的武侠剧,尤其是电视剧中的那些绝世高手更是让人影响深刻,有不少人小时候都幻想过可以武功盖世,一统江湖,那么有人知道武侠剧中有哪些绝世高手吗?下面小编为大家盘点一下吧!...

发布时间:2024-09-20 12:02:19

电视剧中的古装美女:刘亦菲,举止摇曳生姿(天仙下凡)
电视剧中的古装美女:刘亦菲,举止摇曳生姿(天仙下凡)

古装电视剧中有许多的美丽的女子,她们身着美丽的衣裳,一举一动摇曳生姿,美得让人挪不开双眼,可以说是一场视觉盛宴,下面就让小编为大家盘点一下那些古装美女吧!...

发布时间:2024-09-20 11:09:01

清朝古装剧中的美人:刘诗诗,若曦无人超越(顾盼生姿)
清朝古装剧中的美人:刘诗诗,若曦无人超越(顾盼生姿)

近年清朝古装剧收视率暴涨,这些电视剧不仅剧情引人入胜,身着清装的美人也同样吸引了不少目光,有着让人过目不忘的美貌,那么清朝古装剧中有哪些美人呢?下面小编就来为大家盘点一下吧!...

发布时间:2024-09-20 11:02:08

小青龟能长多大:背甲14厘米,体色会变化(濒危物种)
小青龟能长多大:背甲14厘米,体色会变化(濒危物种)

养龟市场上经常可以看到小青龟,这种乌龟乖巧可爱以及性情温顺,所以很多人都会选择小青龟来饲养,不过一直都是见到小青龟都比较小,这不禁令人好奇这种乌龟能长多大?下面小编就带大家一起了解一下小青龟吧!...

发布时间:2024-09-20 10:01:47