Exemples de visualisation de données trompeuses à éviter

Publié: 2022-07-27

La visualisation des données est un outil essentiel pour analyser et communiquer des données complexes . Vous devez être prudent cependant. Lorsque cela est fait de la mauvaise manière, cela déformera ou déformera les informations.

Malheureusement, certains utilisent la visualisation des données pour déformer les données à dessein . Ils ont un agenda ou veulent promouvoir leur propre opinion. D'autres visualisations de données trompeuses sont le résultat d'erreurs ou d'un manque de compréhension de la manière de présenter les données. Le design peut être beau et attrayant mais inadapté à une communication claire de l'information.

Parfois, une visualisation trompeuse des données est évidente ; c'est parfois plus subtil. Il est utile de savoir à quoi ressemble une bonne visualisation des données et quelles sont les meilleures façons de représenter les données.

Cet article vous montrera des exemples de visualisation de données trompeurs qui peuvent vous apprendre des leçons importantes.

Troncature d'échelle

Les graphiques à barres font partie des exemples de visualisation de données les plus populaires. Il donne une idée rapide de la taille relative en comparant les hauteurs de barre. Ils sont faciles à réaliser et tout le monde les comprend .

Le graphique à barres de cet exemple compare les revenus nets de Coca-Cola au cours des dernières années. L'échelle verticale va de 0 à 48 milliards. C'est logique et correct. L'axe Y dans l'exemple suivant commence à 28 milliards, ce qui donne l'impression que la croissance des revenus des années suivantes a explosé dans la stratosphère.

Graphique créé avec wpDataTables

Couper une partie de l'axe vertical accentue les différences de taille des différentes barres. Certains utilisent cette astuce pour tromper les gens en leur faisant croire que les différences de données sont plus grandes qu'elles ne le sont .

Graphique créé avec wpDataTables

Voici un autre exemple. Il compare les revenus d'Apple par région entre 2017 et 2018. À première vue, il semble qu'Apple ait bien mieux performé au Japon qu'en Europe.

Est-ce vrai ou est-ce un exemple de mauvaise visualisation des données ? Si vous regardez de plus près, vous remarquerez la troncature de l'axe Y. Il en résulte une fausse représentation des données.

Voici à quoi cela devrait ressembler:

Graphique créé avec wpDataTables

Manipulation de l'axe Y

Une manipulation supplémentaire de l'axe des ordonnées entraîne davantage d'erreurs de visualisation des données. Vous pouvez afficher l'intégralité de l'axe vertical et le modifier de manière à ce qu'il perde tout son sens. L'une d'entre elles consiste à modifier l'échelle de sorte qu'elle accentue les différences de données .

Ce changement d'axe est un exemple très courant de mauvaise visualisation des données. Les réseaux sociaux regorgent de ces fausses déclarations. Il pousse de faux récits.

Par exemple, quelqu'un peut représenter de petits changements de température dans un graphique. Pour rendre la courbe la moins significative possible , ils utilisent une échelle verticale allant de -10 °C à 100 °C. C'est une astuce courante pour nier les effets du réchauffement climatique.

De petits changements peuvent avoir de grands effets et changer l'histoire derrière un ensemble de données. Regardez ces exemples. Une cote de crédit de 634 sur 700

ne ressemble pas à un pointage de crédit de 634 sur 850.

Masquer les données pertinentes

Mentir sur les données est une mauvaise chose. Mais c'est aussi mauvais que de laisser de côté des points de données parce qu'ils ne conviennent pas à votre objectif.

Omettre certaines données concentre l'attention du public sur une partie spécifique de l'information positive . Cela se fait au détriment de la précision et de la compréhension de l'histoire complète. Chaque point de données a une histoire à raconter et peut transmettre des informations importantes. Pourtant, chaque point de données peut être trompeur lorsqu'il n'y a pas de contexte pertinent.

Analysez cet exemple suivant sur la liste des exemples de visualisation de données trompeuses. En 2018, le Pew Research Center a publié une enquête sur l'utilisation des médias sociaux.

Un mauvais exemple de visualisation de données mettrait trop l'accent sur le fait que 68 % des Américains utilisent Facebook.

Cet exemple montre comment quelqu'un pourrait omettre des points de données pour donner une impression différente de la progression de la croissance. Vous constatez une croissance plus régulière si vous affichez les points de données tous les deux ans

Source des images

au lieu de chaque année. Mais ce n'est pas à cela que ressemble la réalité.

Les entreprises utilisent cette visualisation trompeuse des données en omettant les grandes valeurs aberrantes dans les ventes ou les bénéfices. Cela donne l'impression que l'entreprise est plus stable et prévisible qu'elle ne l'est. Il masque les vrais caprices du marché. Lorsque vous effectuez des visualisations de données, assurez-vous de donner accès à toutes les informations.

Vos belles données méritent d'être en ligne

wpDataTables peut le faire de cette façon. Il y a une bonne raison pour laquelle c'est le plugin WordPress #1 pour créer des tableaux et des graphiques réactifs.

Un exemple réel de wpDataTables dans la nature

Et c'est vraiment facile de faire quelque chose comme ça :

  1. Vous fournissez les données du tableau
  2. Configurez-le et personnalisez-le
  3. Publiez-le dans un article ou une page

Et ce n'est pas seulement joli, mais aussi pratique. Vous pouvez créer de grands tableaux avec jusqu'à des millions de lignes, ou vous pouvez utiliser des filtres et une recherche avancés, ou vous pouvez vous déchaîner et le rendre modifiable.

"Ouais, mais j'aime trop Excel et il n'y a rien de tel sur les sites Web". Oui, il y en a. Vous pouvez utiliser une mise en forme conditionnelle comme dans Excel ou Google Sheets.

Vous ai-je dit que vous pouviez également créer des graphiques avec vos données ? Et ce n'est qu'une petite partie. Il y a beaucoup d'autres fonctionnalités pour vous.

Corrélation et causalité

Montrer des corrélations entre les données est un bon moyen d'aider le public à mieux comprendre le sujet. Vous pouvez le faire en superposant des ensembles de données dans un graphique. La combinaison de l'explication orale et visuelle peut aider les téléspectateurs à établir certains liens importants. Un avertissement est également en place. Trop de superpositions masquent les informations plutôt que de mettre en évidence les connexions.

Graphique créé avec wpDataTables

Lorsqu'elles sont utilisées dans le mauvais sens, les superpositions peuvent impliquer des causes qui n'existent pas. Voici un exemple bien connu. Cela suggère une relation entre la consommation de crème glacée et les crimes violents. En réalité, ils sont tous deux le résultat d'un temps chaud.

La causalité n'est pas la même chose qu'une corrélation dans les données. Maintenant que les ensembles de données deviennent de plus en plus gros, la corrélation est beaucoup plus soulignée. Il est plus facile de déceler une corrélation plutôt que d'établir une véritable causalité entre deux phénomènes.

Il y a une raison importante pour laquelle la causalité n'équivaut pas à la corrélation. La comparaison de deux variables peut masquer la présence d'une troisième variable confusionnelle.

Une troisième variable inconnue peut affecter deux autres variables. Cela peut suggérer la présence d'une relation causale entre les deux. Personne ne peut se rendre compte de la présence de cette troisième variable et il est impossible d'établir une causalité.

Cueillette des cerises

La cueillette de cerises est l'un des nombreux exemples de visualisation de données trompeurs connus. Ce formulaire de visualisation des données omet certaines sources ou éléments d'information .

Le but est de montrer un ensemble de résultats plus clair ou plus prévisible et d'extraire une tendance ou un modèle inexistant. C'est malhonnête et pas objectif. Les résultats deviennent inexacts et incomplets et ne transmettent pas de connaissances réelles.

La cueillette de cerises est une forme de mauvaise visualisation des données souvent observée dans l'industrie pharmaceutique. Un examen attentif peut le montrer dans la présentation des résultats des essais cliniques. Un exemple serait les antidépresseurs. Cela devient clair en comparant les données avec les résultats d'enquêtes financées par le gouvernement sur le même médicament.

L'exemple ci-dessus montre à quel point la sélection de données peut être dangereuse. Un essai clinique peut révéler certaines complexités subtiles. Celles-ci ne peuvent être extraites qu'en considérant des données non falsifiées.

Mise à l'échelle logarithmique peu claire

La valeur entre deux points sur un axe linéaire est toujours la même. Dans le cas d'une échelle logarithmique. la valeur entre deux points diffère selon un certain modèle. C'est le moyen le plus simple de voir la différence entre une échelle linéaire et une échelle logarithmique.

Cela ne signifie pas qu'une représentation logarithmique est une forme de visualisation de données trompeuse. Cela peut être un moyen très efficace d'extraire une relation importante dans l'ensemble de données. Bien sûr, il est important de montrer que le graphique utilise une échelle logarithmique. Si ce n'est pas le cas, cela peut entraîner une perte de signification des données.

Les deux graphiques ci-dessous montrent deux manières de présenter les mêmes données. On utilise une échelle linéaire,

Source des images

tandis que l'autre utilise une échelle logarithmique. Les deux représentations sont, pour l'essentiel, correctes, mais elles semblent différentes.

La leçon est que vous pouvez utiliser une échelle logarithmique, mais d'une manière ou d'une autre, vous devez le faire comprendre au spectateur .

Visualisation non conventionnelle

Les éléments de visualisation de données ont un effet sur la psychologie humaine . Les couleurs, les polices et les icônes ont toutes une certaine connotation plus profonde. Ils influencent la façon dont le spectateur perçoit l'information. Ignorer ou abuser de ces faits sont des exemples de visualisation de données trompeurs.

L'importance de la visualisation des données ne doit pas être sous-estimée. Lorsque le cerveau absorbe de nouvelles informations, il lui faut du temps pour analyser la signification de certains éléments de conception.

Être créatif est une bonne chose et peut ajouter du sens à la visualisation des données. Mais ne distrayez pas le public avec des applications inhabituelles d'associations visuelles habituelles comme dans cet exemple

ou celui-ci sur les morts par arme à feu.

Source des images

Le deuxième exemple est l'un des pires exemples car il est évident que ce que le fabricant essaie de dire sous la surface. C'est une représentation à l'envers non conventionnelle. Cela donne l'impression que les décès par arme à feu sont en baisse en Floride alors que c'est le contraire qui est vrai.

Voici un autre exemple. Il montre une carte des États-Unis avec les taux d'infection par le virus par État.

Source des images

Il montre le taux avec des couleurs différentes. Dans des cartes similaires, différentes nuances de la même couleur montrent la concentration. Plus la couleur est foncée, plus le taux d'infection est élevé. Cette carte ne respecte pas cette convention. Le résultat est très confus et peut être trompeur.

Graphiques à secteurs trompeurs

L'un des plus courants, lorsqu'il s'agit d'exemples de visualisation de données trompeurs, est les graphiques à secteurs. Par définition, un camembert complet représente toujours un total de 100 % . Cela devient déroutant ou trompeur lorsqu'il s'agit d'utiliser des camemberts pour montrer les résultats d'enquêtes avec plus d'une réponse.

L'exemple de ce tableau est correct.

Graphique créé avec wpDataTables

Les pourcentages du diagramme circulaire totalisent 100 %. Imaginez maintenant un sondage où l'une des questions permet aux candidats plus d'une réponse. Par exemple, « Où déménageriez-vous pour une meilleure situation économique ? » Certains pourraient donner deux réponses, par exemple, l'Australie et l'Europe. Ensuite, un graphique circulaire ne fonctionne plus.

Si quelqu'un utilisait ce type de graphique, les informations seraient déformées et inexactes. Un diagramme de Venn serait un meilleur choix dans ce cas.

Données cumulées par rapport aux données annuelles

Une représentation cumulative ajoute des entrées successives. Dans ce cas, le graphique augmente avec chaque point de données.

Les données annuelles montreront les résultats des données absolues pour une année spécifique. Le graphique peut monter et descendre. Dans certains cas, cela pourrait être une représentation plus honnête des résultats.

Le graphique Worldometer COVID-19 sert à illustrer ce point.

Et en effet, les graphiques cumulatifs étaient très populaires pendant la période pandémique.

En outre, de nombreuses entreprises utilisent des graphiques cumulatifs pour montrer leurs résultats. Cela donne l'impression que les résultats des ventes sont meilleurs qu'ils ne le sont, mais ne les laissez pas vous tromper.

En 2013, le PDG d'Apple, Tim Cook, a reçu de nombreuses critiques parce qu'il a utilisé une visualisation de données cumulatives pour montrer les ventes d'iPad. De nombreuses personnes ont estimé qu'Apple tentait de dissimuler la baisse des ventes de leurs produits.

Il n'y a rien de mal à afficher des représentations de données cumulatives si vous le faites de la bonne manière. Il met en évidence, par exemple, les changements dans la croissance. Avant de l'utiliser, réfléchissez à ce que vous voulez montrer et à l'impression que vous voulez donner .

Trop de variables

Vous devez prendre de grandes décisions lorsque vous créez une conception pour une représentation visuelle des données. Qu'incluez-vous et qu'excluez-vous ? Vous voulez être honnête ,   mais la présentation doit également être claire . Plus vous avez de données et plus les détails sont intéressants, plus les décisions sont difficiles.

Ceci est un exemple de comment ne pas le faire.

Le graphique contient trop d'informations et les lignes rendent difficile la distinction des points de données. Vous pouvez même vous demander si le concepteur a tenté de masquer certaines données. Si tel était le but, ils auraient bien réussi. De toute façon, le résultat est inutile.

Une inspection plus approfondie a montré que le graphique représentait le nombre et la gamme d'étudiants à l'examen sur une longue période. Le fait était que les universités admettaient plus d'étudiants issus de groupes minoritaires et de revenus plus faibles. L'inspection a montré qu'au sein de ces groupes, les scores moyens ont augmenté.

Lorsque vous commencez à travailler sur vos visualisations de données, pensez d'abord à ce que vous voulez montrer et aux données dont vous avez besoin pour y parvenir. Le nombre de variables de données déterminera le type de visualisation de données que vous utiliserez. Alors demandez-vous quel format de données sera le plus efficace pour communiquer clairement mon point ?

Mauvaise utilisation des graphiques 3D

Il ne fait aucun doute que votre public adorera les graphiques 3D. Mais vous devez être prudent lorsque vous utilisez des visualisations de données en trois dimensions. Voici pourquoi.

Jetez un oeil à cet exemple.

Source des images

Comme vous pouvez le voir sur la gauche, un graphique 3D peut masquer des données en bloquant d'autres parties du graphique. En effet, un graphique 3D imite l'espace naturel. C'est un problème lorsqu'il ne permet pas un accès visuel aux points de données importants. Cela pourrait créer de fausses hiérarchies et mettre l'accent sur certaines informations.

La distorsion est un autre problème associé aux visualisations de données en trois dimensions. C'est le résultat d'un raccourci. Ceci est courant dans les images car les objets les plus proches de nous semblent plus grands que ceux qui sont éloignés. Mais dans la visualisation de données, c'est un problème. Cela donne l'impression de hiérarchies qui n'existent pas et fausse les relations entre les données.

Utiliser le mauvais type de graphique

Un graphique à secteurs fonctionne mieux lorsqu'il y a deux ou trois éléments. C'est un bon nombre à distinguer pour l'œil humain. La plupart des gens auront du mal à comprendre un graphique à secteurs avec quatre éléments ou plus. Ce diagramme circulaire illustre ce point.

Graphique créé avec wpDataTables

Lequel est le plus grand, Chine ou Autre ?

Les types de données spécifiques demandent un type de graphique spécifique. Certains types de graphiques sont utiles pour présenter des données d'un type différent. Vous pouvez rencontrer de gros problèmes lorsque vous essayez d'utiliser la mauvaise approche de visualisation.

La plupart du temps, le type de données dont vous disposez détermine la façon dont vous les visualisez. Tout d'abord, déterminez si vos données sont qualitatives (descriptives) ou quantitatives (mesures). Les informations qualitatives se prêtent aux diagrammes circulaires et à barres. Il est préférable d'utiliser des histogrammes et des graphiques pour les données quantitatives.

Jetez un oeil à cet exemple.

Il affiche les mêmes données dans un graphique à secteurs et dans un graphique à barres. Le graphique à secteurs n'est pas la meilleure option de visualisation des données. Le graphique à barres représente les chiffres de manière plus précise. Les données d'un camembert totalisent toujours 100 %, mais ce n'est pas le cas ici.

Ne pas utiliser les annotations

Libre à vous d'utiliser ou non des annotations. Ce n'est pas obligatoire de le faire , mais c'est une bonne pratique . Prenez l'habitude de le faire chaque fois que vous créez un graphique.

Des personnes d'horizons différents regarderont vos visualisations de données. Certains ne regarderont que les visuels, d'autres voudront un peu plus d'informations. Ils peuvent avoir besoin de texte et de chiffres pour clarifier leurs doutes.

Voici un exemple qui illustre le propos.

Graphique créé avec wpDataTables

Tout semble bon et les données sont correctement présentées. Mais, lorsque vous regardez les données elles-mêmes, vous vous demandez peut-être pourquoi il y a un si gros pic en 2019. Les annotations peuvent vous aider à clarifier le problème.

Conclusions après ces exemples trompeurs de visualisation de données

Il existe de nombreuses façons dont les gens essaient de manipuler et de déformer les données. Les 13 exemples de visualisation de données trompeuses ci-dessus constituent les plus courants.

Tirez des leçons des erreurs que d'autres personnes ont commises. Soyez déterminé à ne pas faire les mêmes et vos tableaux de bord et présentations seront sans erreur. N'oubliez pas de garder votre public à l'esprit et de réfléchir à ce que vous voulez lui dire.

Grâce à ces connaissances, vous pouvez représenter les données de la bonne manière et permettre aux autres de faire des choix plus éclairés.

Si vous avez apprécié la lecture de cet article sur les exemples trompeurs de visualisation de données, vous devriez également lire ceux-ci :

  • Meilleures pratiques de visualisation des données que vous devez connaître
  • Excellents exemples de palette de couleurs de visualisation de données à utiliser
  • Exemples impressionnants de visualisation de données à découvrir