Exemple înșelătoare de vizualizare a datelor de care să stai departe

Publicat: 2022-07-27

Vizualizarea datelor este un instrument esențial pentru analiza și comunicarea datelor complexe . Trebuie să fii atent totuși. Când este făcut într-un mod greșit, va distorsiona sau denatura informațiile.

Din păcate, unii folosesc vizualizarea datelor pentru a denatura datele în mod intenționat . Au o agendă sau doresc să-și promoveze propria opinie. Alte vizualizări de date înșelătoare sunt rezultatul greșelilor sau al lipsei de înțelegere a modului de prezentare a datelor. Designul poate fi frumos și atrăgător, dar nepotrivit pentru comunicarea clară a informațiilor.

Uneori, vizualizarea datelor înșelătoare este evidentă; uneori este mai subtil. Este util să știți cum arată o vizualizare bună a datelor și care sunt cele mai bune modalități de a reprezenta datele.

Acest articol vă va arăta exemple înșelătoare de vizualizare a datelor care vă pot învăța lecții importante.

Scala trunchierea

Diagramele cu bare sunt unele dintre cele mai populare exemple de vizualizare a datelor. Oferă o idee rapidă despre dimensiunea relativă, comparând înălțimile barelor. Sunt ușor de făcut și toată lumea le înțelege .

Diagrama cu bare din acest exemplu compară venitul net pe care Coca-Cola a avut în ultimii ani. Scara verticală variază de la 0 la 48 miliarde. Este logic și corect. Axa Y din exemplul următor începe de la 28 miliarde, ceea ce face ca creșterea veniturilor din anii următori să pară ca și cum ar fi crescut în stratosferă.

Diagramă creată cu wpDataTables

Tăierea unei părți a axei verticale subliniază diferențele de dimensiune a diferitelor bare. Unii folosesc acest truc pentru a păcăli oamenii să presupună că diferențele de date sunt mai mari decât acestea .

Diagramă creată cu wpDataTables

Iată un alt exemplu. Compară veniturile Apple pe regiune între 2017 și 2018. La prima vedere, se pare că Apple a avut rezultate mult mai bune în Japonia decât în ​​Europa.

Este adevărat sau acesta este un exemplu de vizualizare slabă a datelor? Dacă te uiți mai atent, vei observa trunchierea axei Y. Acest lucru duce la o denaturare a datelor.

Cam așa ar trebui să arate de fapt:

Diagramă creată cu wpDataTables

Manipularea axei Y

Manipularea ulterioară a axei y duce la mai multe greșeli de vizualizare a datelor. Puteți să afișați întreaga axă verticală și să o modificați în așa fel încât să-și piardă orice semnificație. O modalitate este schimbarea scalei astfel încât să accentueze prea mult diferențele de date .

Această schimbare a axei este un exemplu foarte comun de vizualizare proastă a datelor. Rețelele de socializare sunt pline de această denaturare. Impinge narațiuni false.

De exemplu, cineva poate reprezenta mici schimbări de temperatură într-un grafic. Pentru a face curba cât mai nesemnificativă posibil , ei folosesc o scară verticală care variază de la -10 °C la 100 °C. Acesta este un truc comun pentru a nega efectele încălzirii globale.

Micile modificări pot avea efecte mari și pot schimba povestea din spatele unui set de date. Uită-te la aceste exemple. Un scor de credit de 634 din 700

nu arată la fel cu un scor de credit de 634 din 850.

Ascunderea datelor relevante

Mințitul despre date este un lucru rău. Dar este la fel de rău ca să omiteți puncte de date pentru că nu se potrivesc scopului dvs.

Omiterea unor date concentrează atenția publicului asupra unei anumite părți a informațiilor pozitive . Asta cu prețul exactității și înțelegerii întregii povești. Fiecare punct de date are o poveste de spus și poate transmite informații importante. Cu toate acestea, fiecare punct de date poate induce în eroare atunci când nu există un context relevant.

Analizați acest exemplu următor pe lista de exemple de vizualizare a datelor înșelătoare. În 2018, Centrul de Cercetare Pew a publicat un sondaj privind utilizarea rețelelor sociale.

Un exemplu prost de vizualizare a datelor ar sublinia prea mult faptul că 68% dintre americani folosesc Facebook.

Acest exemplu arată cum cineva ar putea omite puncte de date pentru a oferi o altă impresie asupra progresiei creșterii. Vedeți o creștere mai lină dacă afișați punctele de date pentru fiecare doi ani

Sursa imaginii

în loc de fiecare an. Dar nu așa arată realitatea.

Companiile folosesc această vizualizare a datelor înșelătoare, omițând valori aberante mari în vânzări sau profit. Face să pară că compania este mai stabilă și mai previzibilă decât este. Ea maschează adevărata capricios a pieței. Când faceți vizualizări de date, asigurați-vă că oferiți acces la toate informațiile.

Datele tale frumoase merită să fie online

wpDataTables poate face așa. Există un motiv întemeiat pentru care este pluginul WordPress numărul 1 pentru crearea de tabele și diagrame receptive.

Un exemplu real de wpDataTables în sălbăticie

Și este foarte ușor să faci așa ceva:

  1. Dumneavoastră furnizați datele din tabel
  2. Configurați-l și personalizați-l
  3. Publicați-l într-o postare sau pagină

Și nu este doar frumos, ci și practic. Puteți crea tabele mari cu până la milioane de rânduri sau puteți utiliza filtre avansate și puteți căuta, sau puteți face sălbatic și îl puteți edita.

„Da, dar îmi place prea mult Excel și nu există așa ceva pe site-uri”. Da, există. Puteți utiliza formatarea condiționată, cum ar fi Excel sau Foi de calcul Google.

Ți-am spus că poți crea și diagrame cu datele tale? Și asta e doar o mică parte. Există o mulțime de alte funcții pentru tine.

Corelație și cauzalitate

Afișarea corelațiilor dintre date este o modalitate bună de a ajuta publicul să înțeleagă mai bine subiectul. Puteți face acest lucru făcând suprapuneri de seturi de date într-un singur grafic. Combinația dintre explicația orală și cea vizuală poate ajuta telespectatorii să facă anumite conexiuni importante. Există și un avertisment. Prea multe suprapuneri ascund informații mai degrabă decât evidențiază conexiunile.

Diagramă creată cu wpDataTables

Când sunt utilizate în mod greșit, suprapunerile pot implica cauze care nu există. Iată un exemplu binecunoscut. Acesta sugerează o relație între consumul de înghețată și criminalitatea violentă. În realitate, ambele sunt rezultatul vremii calde.

Cauzația nu este același lucru cu o corelație în date. Acum, că seturile de date devin din ce în ce mai mari, corelația este mult mai accentuată. Este mai ușor să detectezi o corelație decât să stabilești o adevărată cauzalitate între două fenomene.

Există un motiv important pentru care cauzalitatea nu echivalează cu corelația. Compararea a două variabile poate ascunde prezența unei a treia variabile de confuzie.

O a treia variabilă necunoscută poate afecta alte două variabile. Poate da sugestia prezenței unei relații cauzale între cele două. Nimeni nu poate realiza prezența acelei a treia variabile și este imposibil să se stabilească cauzalitate.

Culegere cireșe

Alegerea cireșelor este unul dintre numeroasele exemple de vizualizare a datelor înșelătoare cunoscute. Acest formular de vizualizare a datelor omite anumite surse sau informații .

Scopul este de a arăta un set de rezultate mai curat sau mai previzibil și de a extrage o tendință sau un model inexistent. Este necinstit și nu obiectiv. Rezultatele devin inexacte și incomplete și nu transmit cunoștințe reale.

Culegerea de cireșe este o formă de vizualizare proastă a datelor des întâlnită în industria farmaceutică. O revizuire atentă o poate arăta în prezentarea rezultatelor studiilor clinice. Un exemplu ar fi antidepresivele. Devine clar prin compararea datelor cu rezultatele investigațiilor finanțate de guvern ale aceluiași medicament.

Exemplul de mai sus arată cât de periculoasă poate fi alegerea datelor. Un studiu clinic poate dezvălui anumite complexități subtile. Acestea pot fi extrase doar prin luarea în considerare a datelor nealterate.

Scalare logaritmică neclară

Valoarea dintre două puncte de pe o axă liniară este întotdeauna aceeași. În cazul unei scale logaritmice. valoarea dintre două puncte diferă după un anumit model. Acesta este cel mai simplu mod de a vedea diferența dintre o scară liniară și una logaritmică.

Asta nu înseamnă că o reprezentare logaritmică este o formă de vizualizare a datelor înșelătoare. Poate fi o modalitate foarte eficientă de a extrage o relație importantă în setul de date. Desigur, este important să arătăm că graficul folosește o scară logaritmică. Dacă nu este cazul, poate duce la pierderea semnificației datelor.

Cele două grafice de mai jos arată două moduri de a prezenta aceleași date. Se folosește o scară liniară,

Sursa imaginii

în timp ce celălalt folosește o scară logaritmică. Ambele reprezentări sunt, în esență, corecte, dar arată diferit.

Lecția este că poți folosi o scară logaritmică, dar cumva trebuie să faci asta clar pentru spectator .

Vizualizare neconvențională

Elementele de vizualizare a datelor au un efect asupra psihologiei umane . Culorile, fonturile și pictogramele au toate o anumită conotație mai profundă. Ele influențează modul în care privitorul percepe informația. Ignorarea sau abuzarea acestor fapte sunt exemple de vizualizare a datelor înșelătoare.

Importanța vizualizării datelor nu trebuie subestimată. Când creierul preia informații noi, este nevoie de timp pentru a analiza semnificația anumitor elemente de design.

A fi creativ este bine și poate adăuga sens vizualizării datelor. Dar nu distrageți atenția publicului cu aplicații neobișnuite ale asociațiilor vizuale obișnuite, ca în acest exemplu

sau acesta despre morțile cu arme.

Sursa imaginii

Al doilea exemplu este unul dintre cele mai proaste exemple, deoarece este evident ceea ce producătorul încearcă să spună sub suprafață. Este o reprezentare neconvențională cu susul în jos. Dă impresia că decesele cu arme sunt în scădere în Florida, când este adevărat opusul.

Iată un alt exemplu. Acesta arată o hartă a Statelor Unite cu ratele de infectare cu virusul pe stat.

Sursa imaginii

Arată rata cu diferite culori. În hărți similare, nuanțe diferite ale aceleiași culori arată concentrația. Cu cât culoarea este mai închisă, cu atât este mai mare rata de infecție. Această hartă nu respectă această convenție. Rezultatul este foarte confuz și poate induce în eroare.

Diagrame circulare înșelătoare

Unul dintre cele mai comune, atunci când vine vorba de exemple de vizualizare a datelor înșelătoare, sunt diagramele circulare. Prin definiție, o diagramă circulară completă reprezintă întotdeauna un total de 100% . Acest lucru devine confuz sau înșelător atunci când vine vorba de utilizarea diagramelor circulare pentru a afișa rezultatele sondajelor cu mai multe răspunsuri.

Exemplul din acest grafic este corect.

Diagramă creată cu wpDataTables

Procentele din diagrama circulară se adună până la 100%. Acum imaginați-vă un sondaj în care una dintre întrebări permite candidaților mai multe răspunsuri. De exemplu, „Unde te-ai muta pentru o situație economică mai bună?” Unii ar putea da două răspunsuri, de exemplu, Australia și Europa. Atunci o diagramă circulară nu mai funcționează.

Dacă cineva ar folosi acest tip de diagramă, informațiile devin distorsionate și inexacte. O diagramă Venn ar fi o alegere mai bună în acest caz.

Date cumulate vs. anuale

O reprezentare cumulativă adaugă intrări succesive. În acest caz, graficul crește cu fiecare punct de date.

Datele anuale vor afișa rezultatele absolute ale datelor pentru un anumit an. Graficul poate merge în sus și în jos. În unele cazuri, aceasta ar putea fi o reprezentare mai sinceră a rezultatelor.

Graficul Worldometer COVID-19 servește pentru a ilustra acest punct.

Și într-adevăr, graficele cumulate au fost foarte populare în perioada pandemiei.

De asemenea, multe companii folosesc grafice cumulate pentru a-și arăta rezultatele. Face ca rezultatele vânzărilor să pară mai bune decât sunt, dar nu-i lăsa să te păcălească.

În 2013, CEO-ul Apple, Tim Cook, a primit multe critici pentru că a folosit o vizualizare cumulativă a datelor pentru a arăta vânzările de iPad. Mulți oameni au simțit că Apple a încercat să acopere scăderea vânzărilor produselor lor.

Nu este nimic în neregulă cu afișarea reprezentărilor de date cumulate dacă o faci în mod corect. Evidențiază, de exemplu, schimbările de creștere. Înainte de a-l folosi, gândește-te la ce vrei să arăți și la ce impresie vrei să dai .

Prea multe variabile

Trebuie să iei decizii mari atunci când faci un design pentru o reprezentare vizuală a datelor. Ce includeți și ce excludeți? Vrei să fii sincer ,   dar și prezentarea trebuie să fie clară . Cu cât ai mai multe date și cu cât detaliile sunt mai interesante, cu atât deciziile sunt mai grele.

Acesta este un exemplu despre cum să nu o faci.

Graficul conține prea multe informații, iar liniile fac dificilă distingerea oricărui punct de date. S-ar putea să vă întrebați chiar dacă designerul a încercat să ascundă unele date. Dacă acesta era scopul, probabil că au reușit. În orice caz, rezultatul este inutil.

O inspecție mai atentă a arătat că graficul a reprezentat numărul și gama de studenți la examen pe o perioadă lungă. Ideea a fost că universitățile au admis mai mulți studenți din grupuri minoritare și venituri mai mici. Inspecția a arătat că în cadrul acestor grupuri scorurile medii au crescut.

Când începeți să lucrați la vizualizările de date, mai întâi gândiți-vă la ce doriți să afișați și la ce date aveți nevoie pentru a realiza acest lucru. Numărul de variabile de date va determina ce fel de vizualizare a datelor veți utiliza. Așadar, întreabă-te, ce format de date va fi cel mai eficient pentru a-mi comunica în mod clar punctul de vedere?

Utilizarea greșită a graficii 3D

Nu există nicio îndoială că publicul tău va adora graficele 3D. Dar trebuie să fiți precaut atunci când utilizați vizualizări de date tridimensionale. Iată de ce.

Aruncă o privire la acest exemplu.

Sursa imaginii

După cum puteți vedea în stânga, un grafic 3D poate ascunde datele prin blocarea altor părți ale diagramei. Acest lucru se datorează faptului că un grafic 3D imită spațiul natural. Aceasta este o problemă atunci când nu permite accesul vizual la punctele de date importante. Acest lucru ar putea crea ierarhii false și accent pe anumite informații.

Distorsiunea este o altă problemă asociată cu vizualizările tridimensionale de date. Este rezultatul scurtării. Acest lucru este obișnuit în imagini deoarece obiectele mai apropiate de noi par mai mari decât cele aflate la distanță. Dar în vizualizarea datelor, aceasta este o problemă. Dă impresia de ierarhii care nu există și deformează relațiile de date.

Utilizarea tipului de diagramă greșit

O diagramă circulară funcționează cel mai bine atunci când există două până la trei elemente. Acesta este un număr bun pentru a distinge ochiul uman. Majoritatea oamenilor vor avea dificultăți în înțelegerea unei diagrame cu patru sau mai multe elemente. Această diagramă circulară exemplifica punctul.

Diagramă creată cu wpDataTables

Care este mai mare, China sau alta?

Tipuri specifice de date solicită un anumit tip de diagramă. Anumite tipuri de diagrame sunt utile pentru prezentarea datelor de alt tip. Puteți întâmpina mari probleme atunci când încercați să utilizați o abordare greșită de vizualizare.

De cele mai multe ori tipul de date pe care le aveți determină modul în care le vizualizați. În primul rând, luați în considerare dacă datele dvs. sunt calitative (descriptive) sau cantitative (măsuri). Informațiile calitative se pretează la diagrame cu plăci și bare. Cel mai bine este să folosiți histograme și diagrame pentru date cantitative.

Aruncă o privire la acest exemplu.

Afișează aceleași date într-o diagramă circulară și într-o diagramă cu bare. Diagrama circular nu este cea mai bună opțiune de vizualizare a datelor. Diagrama cu bare reprezintă numerele într-un mod mai precis. Datele dintr-o plăcintă se adună întotdeauna până la 100%, dar nu este cazul aici.

Nu se folosesc adnotări

Depinde de tine să folosești sau nu adnotări. Nu este obligatoriu să o faci , dar este o bună practică . Fă-ți un obicei să o faci de fiecare dată când faci o diagramă.

Persoanele cu medii diferite se vor uita la vizualizările tale de date. Unii se vor uita doar la imagini, alții vor dori puțin mai multe informații. Ar putea avea nevoie de text și numere pentru a clarifica îndoielile pe care le au.

Iată un exemplu care ilustrează ideea.

Diagramă creată cu wpDataTables

Totul arată bine și datele sunt prezentate corect. Dar, când te uiți la datele în sine, s-ar putea să te întrebi de ce există o creștere atât de mare în 2019. Adnotările vă pot ajuta să clarificați problema.

Concluzii după aceste exemple de vizualizare a datelor înșelătoare

Există multe moduri prin care oamenii încearcă să manipuleze și să denatureze datele. Cele 13 exemple de vizualizare a datelor înșelătoare de mai sus constituie cele mai comune.

Învață lecții din greșelile pe care le-au făcut alți oameni. Fii hotărât să nu faci aceleași, iar tablourile de bord și prezentările tale vor fi fără erori. Nu uita să ții cont de publicul tău și să te gândești la ceea ce vrei să le spui.

Cu aceste cunoștințe, puteți reprezenta datele în mod corect și le puteți permite altora să facă alegeri mai bine informate.

Dacă ți-a plăcut să citești acest articol despre exemple de vizualizare a datelor înșelătoare, ar trebui să le citești și pe acestea:

  • Cele mai bune practici de vizualizare a datelor pe care trebuie să le cunoașteți
  • Exemple excelente de paletă de culori pentru vizualizarea datelor
  • Exemple impresionante de vizualizare a datelor de verificat