远离误导性数据可视化示例

已发表: 2022-07-27

数据可视化是分析和交流复杂数据材料的重要工具。 不过你必须小心。 如果以错误的方式完成,它将扭曲或歪曲信息。

可悲的是,有些人故意使用数据可视化来歪曲数据。 他们有议程或想要宣传自己的观点。 其他误导性的数据可视化是错误或对如何呈现数据缺乏了解的结果。 设计可能很漂亮和吸引人,但不适合清晰地传达信息。

有时误导性的数据可视化很明显; 有时它更微妙。 了解好的数据可视化是什么样的以及表示数据的最佳方式是很有用的。

本文将向您展示误导性的数据可视化示例,这些示例可以教给您重要的课程。

比例截断

条形图是一些最流行的数据可视化示例。 它通过比较条形高度来快速了解相对大小。 它们很容易制作,每个人都理解它们

此示例中的条形图比较了可口可乐过去几年的净收入。 垂直尺度从 0 到 480 亿。 这是合乎逻辑和正确的。 下一个示例中的 Y 轴从 280 亿美元开始,这使得接下来几年的收入增长看起来像是膨胀到了平流层。

使用 wpDataTables 创建的图表

切断垂直轴的一部分强调不同条的大小差异。 有些人使用这个技巧来欺骗人们假设数据的差异比实际更大

使用 wpDataTables 创建的图表

这是另一个例子。 它比较了 2017 年和 2018 年苹果在每个地区的收入。乍一看,苹果在日本的表现似乎比在欧洲好得多。

这是真的吗,或者这是一个糟糕的数据可视化的例子? 如果仔细观察,您会注意到 Y 轴的截断。 这会导致数据的错误陈述。

它实际上应该是这样的:

使用 wpDataTables 创建的图表

Y 轴的操作

对 y 轴的进一步操作会导致更多的数据可视化错误。 您可以显示整个垂直轴,但仍然可以对其进行更改,使其失去所有意义。 一种方法是改变比例,使其过分强调数据差异

这种轴变化是糟糕数据可视化的一个非常常见的例子。 社交媒体上充斥着这种虚假陈述。 它推动了虚假的叙述。

例如,有人可能会在图表中表示微小的温度变化。 为了使曲线尽可能不显着,他们使用从 -10 °C 到 100 °C 的垂直刻度。 这是否认全球变暖影响的常用伎俩。

小的变化可以产生大的影响,并改变数据集背后的故事。 看看这些例子。 信用评分为 634 分(满分 700 分)

看起来与 850 分中的 634 分的信用评分不同。

隐藏相关数据

对数据撒谎是一件坏事。 但这与遗漏数据点一样糟糕,因为它们不适合您的目的。

省略一些数据会将观众的注意力集中在正面信息的特定部分上。 这是以准确性和理解完整故事为代价的。 每个数据点都有一个故事要讲,并且可以传达重要信息。 然而,当没有相关上下文时,每个数据点都可能会产生误导。

在误导性数据可视化示例列表中分析下一个示例。 2018 年,皮尤研究中心发布了一项关于社交媒体使用的调查。

数据可视化的一个糟糕例子会过分强调 68% 的美国人使用 Facebook 的事实。

这个例子展示了人们如何遗漏数据点以对增长进程给出不同的印象。 如果您每两年显示一次数据点,您会看到更平稳的增长

图片来源

而不是每年。 但这不是现实的样子。

公司通过忽略销售或利润中的大异常值来使用这种误导性的数据可视化。 它使公司看起来比实际更稳定和可预测。 它掩盖了市场真正的反复无常。 当您进行数据可视化时,请确保授予对所有信息的访问权限。

您美丽的数据值得在线

wpDataTables可以做到这一点。 它是用于创建响应式表格和图表的排名第一的 WordPress 插件是有充分理由的。

wpDataTables 的实际例子

做这样的事情真的很容易:

  1. 您提供表格数据
  2. 配置和定制它
  3. 在帖子或页面中发布

它不仅漂亮,而且实用。 您可以制作包含数百万行的大型表格,或者您可以使用高级过滤器和搜索,或者您可以疯狂并使其可编辑。

“是的,但我就是太喜欢 Excel,而网站上没有这样的东西”。 是的,有。 您可以使用 Excel 或 Google 表格中的条件格式。

我是否告诉过您您也可以使用您的数据创建图表? 而这只是一小部分。 还有很多其他功能适合您。

相关性和因果关系

显示数据之间的相关性是帮助观众更好地理解主题的好方法。 您可以通过在一张图中叠加数据集来做到这一点。 口头和视觉解释的结合可以帮助观众建立某些重要的联系。 警告也已到位。 太多的覆盖会掩盖信息,而不是突出连接。

使用 wpDataTables 创建的图表

当以错误的方式使用时,覆盖可能暗示不存在的因果关系。 这是一个众所周知的例子。 它表明了冰淇淋消费与暴力犯罪之间的关系。 实际上,它们都是温暖天气的结果。

因果关系与数据中的相关性不同。 现在数据集变得越来越大,相关性被更加强调。 检测相关性比在两种现象之间建立真正的因果关系更容易。

因果关系不等于相关性有一个重要原因。 比较两个变量可能会掩盖第三个混杂变量的存在。

未知的第三个变量会影响其他两个变量。 它可能会暗示两者之间存在因果关系。 没有人会意识到第三个变量的存在,也无法确定因果关系。

采摘樱桃

樱桃采摘是已知的许多误导性数据可视化示例之一。 这种数据可视化形式省略了某些来源或信息片段

目的是显示更清晰或更可预测的结果集并提取不存在的趋势或模式。 这是不诚实和不客观的。 结果变得不准确和不完整,并且不能传达实际的知识。

樱桃采摘是制药行业常见的一种不良数据可视化形式。 仔细审查可以在临床试验结果的介绍中体现出来。 一个例子是抗抑郁药。 通过将数据与政府资助的对同一药物的调查结果进行比较,可以清楚地看出这一点。

上面的示例显示了挑选数据的危险性。 临床试验可以揭示某些微妙的复杂性。 这些只有通过考虑纯数据才能提取。

不明确的对数标度

线性轴上两点之间的值始终相同。 在对数刻度的情况下。 两点之间的值根据某种模式而不同。 这是查看线性刻度和对数刻度之间差异的最简单方法。

这并不意味着对数表示是一种误导性的数据可视化形式。 它可以是提取数据集中重要关系的一种非常有效的方法。 当然,重要的是要表明该图使用对数刻度。 如果不是这种情况,则可能导致数据重要性的丢失。

下面的两个图表显示了呈现相同数据的两种方式。 一个使用线性刻度,

图片来源

而另一个使用对数刻度。 这两种表示本质上都是正确的,但它们看起来不同。

教训是您可以使用对数刻度,但您需要以某种方式让查看者清楚这一点

非常规可视化

数据可视化元素对人类心理有影响。 颜色、字体和图标都有一定的更深层次的内涵。 它们影响观众感知信息的方式。 忽略或滥用这些事实是误导性的数据可视化示例。

不应低估数据可视化的重要性。 当大脑接收新信息时,需要时间来分析某些设计元素的含义。

有创意是好的,可以为数据可视化增加意义。 但是不要像这个例子那样用通常的视觉联想的不寻常应用分散观众的注意力

或者这个关于枪支死亡的。

图片来源

第二个例子是最糟糕的例子之一,因为制造商试图在表面下说什么是显而易见的。 这是一种非常规的颠倒表示。 它给人的印象是,佛罗里达州的枪支死亡人数正在下降,而事实恰恰相反。

这是另一个例子。 它显示了一张美国地图,其中包含每个州的病毒感染率。

图片来源

它以不同的颜色显示速率。 在相似的地图中,相同颜色的不同深浅表示浓度。 颜色越深,感染率越高。 此地图不遵循此约定。 结果非常混乱,可能会产生误导。

误导饼图

当涉及到误导性的数据可视化示例时,最常见的一种是饼图。 根据定义,一个完整的饼图总代表 100% 。 当使用饼图显示具有多个答案的调查结果时,这会变得令人困惑或误导。

此图表中的示例是正确的。

使用 wpDataTables 创建的图表

饼图中的百分比加起来为 100%。 现在想象一个调查,其中一个问题允许候选人提供多个答案。 例如,“你会搬到哪里以获得更好的经济状况?” 有些人可能会给出两个答案,例如澳大利亚和欧洲。 然后饼图不再起作用。

如果有人使用这种图表类型,信息就会变得扭曲和不准确。 在这种情况下,维恩图将是更好的选择。

累积与年度数据

累积表示添加连续的输入。 在这种情况下,图表会随着每个数据点上升。

年度数据将显示特定年份的绝对数据结果。 图表可以上下浮动。 在某些情况下,这可能是对结果的更诚实的表示。

Worldometer COVID-19 图表可以说明这一点。

事实上,累积图表在大流行期间非常流行。

此外,许多公司使用累积图来展示他们的结果。 它使销售结果看起来比实际更好,但不要让他们欺骗你。

2013 年,苹果 CEO 蒂姆·库克 (Tim Cook) 受到了很多批评,因为他使用累积数据可视化来展示 iPad 的销售情况。 许多人认为苹果试图掩盖其产品销量的下降。

如果以正确的方式显示累积数据表示并没有错。 例如,它确实突出了增长的变化。 在使用它之前,想想你想展示什么,你想给人什么样的印象

变量太多

在为可视化数据表示进行设计时,您需要做出重大决定。 你包括什么,你排除什么? 你要诚实   但演示文稿也必须清晰。 您拥有的数据越多,细节越有趣,决策就越困难。

这是一个如何不做的例子。

该图包含太多信息,并且线条难以区分任何数据点。 您甚至可能想知道设计者是否试图掩盖某些数据。 如果这是目标,他们可能已经成功了。 无论如何,结果是无用的。

仔细检查表明,该图表代表了长期考试学生的数量和范围。 关键是大学录取了更多来自少数族裔和较低收入的学生。 检查表明,在这些组中,平均分数有所增加。

当您开始进行数据可视化工作时,首先要考虑您想要展示什么以及需要哪些数据来实现这一目标。 数据变量的数量将决定您将使用哪种数据可视化。 所以问问你自己,什么数据格式最能有效地清楚地传达我的观点?

错误使用 3D 图形

毫无疑问,您的观众会喜欢 3D 图表。 但是在使用三维数据可视化时需要谨慎。 这就是为什么。

看看这个例子。

图片来源

正如您在左侧看到的,3D 图表可以通过阻止图表的其他部分来掩盖数据。 这是因为 3D 图形模仿了自然空间。 当它不允许对重要数据点进行可视访问时,这是一个问题。 这可能会产生错误的层次结构并强调某些信息。

失真是与三维数据可视化相关的另一个问题。 这是缩短的结果。 这在图片中很常见,因为离我们近的物体看起来比远处的大。 但在数据可视化中,这是一个问题。 它给人的印象是不存在的层次结构并扭曲了数据关系。

使用错误的图表类型

当有两到三个项目时,饼图效果最好。 这对于人眼来说是一个很好区分的数字。 大多数人很难理解包含四个或更多项目的饼图。 这个饼图说明了这一点。

使用 wpDataTables 创建的图表

哪个更大,中国还是其他?

特定数据类型要求特定图表类型。 某些图表类型可用于呈现不同类型的数据。 当您尝试使用错误的可视化方法时,您可能会遇到大麻烦。

大多数情况下,您拥有的数据类型决定了您对其进行可视化的方式。 首先,考虑您的数据是定性(描述性)还是定量(测量)。 定性信息适用于饼图和条形图。 定量数据最好使用直方图和图表。

看看这个例子。

它在饼图和条形图中显示相同的数据。 饼图不是最好的数据可视化选项。 条形图以更准确的方式表示数字。 饼图中的数据总和为 100%,但这里不是这样。

不使用注释

是否使用注释取决于您。 这不是强制性的但它是一种很好的做法。 养成每次制作图表时都这样做的习惯。

具有不同背景的人会查看您的数据可视化。 有些人只会看视觉效果,有些人会想要更多信息。 他们可能需要文字和数字来澄清他们的疑虑。

这是一个说明这一点的例子。

使用 wpDataTables 创建的图表

一切看起来都很好,并且数据正确呈现。 但是,当您查看数据本身时,您可能想知道为什么 2019 年会出现如此大的峰值。注释可以帮助您澄清问题。

这些误导性数据可视化示例之后的结论

人们试图通过多种方式操纵和歪曲数据。 上面 13 个具有误导性的数据可视化示例构成了最常见的示例。

从其他人所犯的错误中吸取教训。 下定决心不要做同样的事情,你的仪表板和演示文稿将没有错误。 记住要记住你的听众,想想你想告诉他们什么。

有了这些知识,您可以以正确的方式表示数据,并允许其他人做出更明智的选择。

如果您喜欢阅读这篇关于误导性数据可视化示例的文章,那么您也应该阅读以下内容:

  • 您需要了解的数据可视化最佳实践
  • 伟大的数据可视化调色板示例使用
  • 令人印象深刻的数据可视化示例