Statisticile înșelătoare pot fi periculoase (câteva exemple)

Publicat: 2022-12-06

Oamenii se bazează pe statistici pentru a obține informații importante. În lumea afacerilor, statisticile pot fi utile pentru urmărirea tendințelor și maximizarea productivității. Dar uneori statisticile pot fi prezentate într-un mod înșelător . De exemplu, în 2007, Advertising Standards Authority (ADA) din Marea Britanie a primit o plângere cu privire la un anunț Colgate.

Anunțul susține că 80% dintre stomatologi recomandă utilizarea pastei de dinți Colgate. Plângerea primită de ADA a susținut că aceasta a fost o încălcare a regulilor de publicitate din Regatul Unit. După ce a analizat chestiunea, ADA a descoperit că anunțul folosea statistici înșelătoare.

Este adevărat că mulți stomatologi recomandă pasta de dinți Colgate. Dar nu toți au citat Colgate drept recomandarea numărul unu. Majoritatea stomatologilor au recomandat și alte tipuri de pastă de dinți, iar Colgate a apărut de obicei la un moment dat mai târziu.

Acesta este doar un exemplu al modului în care sunt folosite statisticile înșelătoare. Oamenii dau peste exemple de statistici înșelătoare în multe domenii diferite ale vieții. Puteți găsi exemple în știri, în publicitate, în politică și chiar în știință.

Această postare vă va ajuta să învățați să recunoașteți statisticile înșelătoare și alte date înșelătoare . Se va discuta despre modul în care aceste date induc oamenii în eroare. De asemenea, veți învăța când și cum să utilizați datele atunci când luați decizii critice.

Ce sunt statisticile înșelătoare?

Statisticile sunt rezultatul culegerii datelor numerice, analizându-le cu atenție și apoi interpretându-le . Este deosebit de util să aveți statistici dacă aveți de-a face cu o cantitate mare de date, dar orice poate fi măsurat poate deveni o statistică. Statisticile dezvăluie adesea multe despre lume și despre modul în care funcționează.

Cu toate acestea, atunci când această informație este folosită greșit, chiar și accidental, devine o statistică înșelătoare. Statisticile înșelătoare oferă oamenilor informații false care îi înșală mai degrabă decât să-i informeze .

Când oamenii scot o statistică din context, aceasta își pierde valoarea și îi poate determina pe oameni să tragă concluzii incorecte. Termenul „statistici înșelătoare” descrie orice metodă statistică care reprezintă datele incorect. Indiferent dacă a fost intenționat sau nu , ar conta totuși drept statistici înșelătoare.

Atunci când colectați date pentru o statistică, există trei puncte principale de care trebuie să aveți în vedere. O problemă cu analiza datelor ar putea apărea în oricare dintre aceste puncte.

  • Colectare: în timpul culegerii datelor
  • Prelucrare: La analiza datelor și implicațiile acestora
  • Prezentare: Când împărtășiți descoperirile dvs. cu alții

O dimensiune mică a eșantionului

Sondajele privind dimensiunea eșantionului sunt un exemplu de creare a statisticilor înșelătoare. Sondajele sau studiile efectuate pe un public de dimensiunea eșantionului produc adesea rezultate atât de înșelătoare încât sunt inutilizabile.

Pentru a ilustra, un sondaj pune 20 de persoane o întrebare da sau nu. 19 dintre persoane au răspuns da la sondaj. Deci rezultatele arată că 95% dintre oameni ar răspunde da la această întrebare. Dar acesta nu este un sondaj bun, deoarece informațiile sunt limitate.

Această statistică nu are valoare reală. Acum, dacă pui aceeași întrebare a 1.000 de oameni și 950 au spus da, atunci aceasta este o statistică mult mai fiabilă care să arate că 95% dintre oameni ar spune da.

Pentru a efectua un studiu de încredere privind dimensiunea eșantionului, trebuie să luați în considerare trei lucruri:

  • Unu : Ce fel de întrebare pui?
  • Doi : Care este semnificația statisticii pe care încercați să o găsiți?
  • Și trei : Ce tehnică statistică vei folosi?

Pentru a avea rezultate fiabile, orice analiză cantitativă a dimensiunii eșantionului ar trebui să includă cel puțin 200 de persoane.

Întrebări încărcate

Este important să căutați date dintr-o sursă neutră . În caz contrar, informația este înclinată. Întrebările încărcate folosesc o presupunere controversată sau nejustificată pentru a manipula răspunsul. Un exemplu în acest sens este adresarea unei întrebări care începe: „Despre ce îți place?” Această întrebare face o treabă grozavă de a colecta feedback pozitiv, dar nu reușește să vă învețe nimic util. Nu oferă nicio oportunitate persoanei de a-și da gândurile și opiniile sincere.

Luați în considerare diferența dintre următoarele două întrebări:

  • Susțineți o reformă fiscală care ar presupune taxe mai mari?
  • Susțineți o reformă fiscală care ar fi benefică pentru redistribuirea socială?

Întrebarea se referă în esență la același subiect, dar rezultatele fiecăreia dintre aceste întrebări ar fi destul de diferite. Sondajele ar trebui să fie efectuate într-o manieră imparțială, imparțială. Vrei să obții părerile sincere ale oamenilor și o imagine completă a ceea ce gândesc oamenii. Pentru a realiza acest lucru, întrebările dumneavoastră nu ar trebui să implice răspunsul și nici să provoace un răspuns emoțional .

Citând „medii” înșelătoare

Unii oameni folosesc termenul „mediu” pentru a ascunde adevărul sau pentru a minți pentru a face informațiile să arate mai bine.

Această tehnică este utilă în special dacă cineva dorește să facă un număr să pară mai mare sau mai bun decât este. De exemplu, o universitate care dorește să atragă noi studenți poate oferi un salariu „mediu” anual pentru absolvenții școlii lor. Dar s-ar putea să fie doar o mână de studenți care au de fapt salarii mari. Dar salariile lor fac venitul mediu pentru toți studenții mai mare. Asta arată mai bine pentru întreaga medie.

Mediile sunt utile și pentru a ascunde inegalitatea. Ca un alt exemplu, să presupunem că o companie plătește 20.000 USD pe an celor 90 de angajați. Dar șeful lor primește 200.000 de dolari pe an. Dacă combinați salariul șefului și salariul angajaților, venitul mediu pentru fiecare membru al companiei este de 21.978 USD.

Pe hârtie, asta arată grozav. Dar acest număr nu reușește să spună întreaga poveste, deoarece unul dintre angajați (șeful) câștigă mult mai mult decât ceilalți muncitori. Deci, aceste tipuri de rezultate sunt considerate statistici înșelătoare.

Date cumulate vs. anuale

Datele cumulate urmăresc informațiile dintr-un grafic în timp. De fiecare dată când introduceți date în diagrame, graficul crește.

Datele anuale prezintă toate datele pentru un anumit an.

Informațiile de urmărire pentru fiecare an oferă o imagine mai fidelă a tendințelor generale.

Un exemplu de grafic cumulativ este graficul Worldometer COVID-19. În timpul pandemiei de COVID-19, au apărut multe exemple de grafice cumulative. Ele reflectă adesea numărul cumulat de cazuri de COVID într-o anumită zonă.

Unele companii folosesc astfel de grafice pentru a face vânzările să pară mai mari decât sunt. În 2013, CEO-ul Apple, Tim Cook, a primit critici pentru că a folosit o prezentare care arată doar numărul cumulat de vânzări de iPhone. Mulți au simțit la acea vreme că a făcut asta în mod intenționat pentru a ascunde faptul că vânzările de iPhone erau în scădere.

Acest lucru nu înseamnă că toate datele cumulate sunt proaste sau false. De fapt, poate fi util pentru urmărirea modificărilor sau creșterii și a diferitelor totaluri. Dar cel mai important este să acordați atenție modificărilor date. Apoi uitați-vă mai profund în ceea ce i-a cauzat, mai degrabă decât să vă bazați pe diagramă pentru a vă spune totul.

Suprageneralizare și eșantioane părtinitoare

Suprageneralizarea apare atunci când cineva presupune că ceea ce este adevărat pentru o persoană trebuie să fie adevărat pentru toți ceilalți. De obicei, această eroare apare atunci când cineva efectuează un studiu cu un anumit grup de oameni. Apoi, ei presupun că rezultatele vor fi adevărate pentru un alt grup de oameni, neînrudit.

Eșantioanele nereprezentative sau eșantioanele părtinitoare sunt sondaje care nu reprezintă cu exactitate populația generală.

Un exemplu de eșantioane părtinitoare a avut loc în timpul alegerilor prezidențiale din 1936 din Statele Unite ale Americii.

The Literary Digest, o revistă populară la acea vreme, a realizat un sondaj pentru a prezice cine va câștiga alegerile. Rezultatele au prezis că Alfred Landon va câștiga printr-o alunecare de teren.

Această revistă era cunoscută pentru că a prezis cu exactitate rezultatul alegerilor. Anul acesta, însă, s-au înșelat complet. Franklin Roosevelt a câștigat cu aproape dublu vot față de adversarul său.

Mai multe cercetări au arătat că două variabile au intrat în joc care au denaturat rezultatele.

În primul rând , majoritatea participanților la sondaj au fost persoane găsite în agenda telefonică și pe listele de înmatriculare auto. Deci sondajul a fost realizat doar cu cei dintr-un anumit statut socio-economic.

Al doilea factor a fost că cei care au votat pentru Landon au fost mai dispuși să răspundă la sondaj decât cei care au ales să voteze pentru Roosevelt. Deci rezultatele au reflectat această părtinire.

Trunchierea unei axe

Trunchierea axei pe un grafic este un alt exemplu de statistici înșelătoare. Pe majoritatea graficelor statistice, atât axa x cât și axa y încep de la zero. Dar trunchierea axei înseamnă că graficul începe de fapt axele la o altă valoare. Acest lucru afectează modul în care va arăta un grafic și afectează concluziile pe care le va trage o persoană.

Iată un exemplu care ilustrează acest lucru:

Sursa imaginii

Un alt exemplu în acest sens s-a întâmplat recent în septembrie 2021. Într-o emisiune Fox News, prezentatorul a folosit un grafic care arată numărul de americani care pretindeau că sunt creștini. Graficul a arătat că numărul americanilor care s-au identificat drept creștini a scăzut drastic în ultimii 10 ani.

În graficul următor, vedem că în 2009 77% dintre americani s-au identificat ca fiind creștini.

Sursa imaginii

Până în 2019, numărul a scăzut la 65%. În realitate, aceasta nu este o scădere uriașă. Dar axa din acest grafic începe la 58% și se oprește la 78%. Deci, scăderea de 12% din 2009 până în 2019 pare mult mai drastică decât este de fapt.

Cauzalitate și corelație

Poate fi ușor să presupunem o conexiune între două puncte de date aparent conectate. Cu toate acestea, se spune că corelația nu implică cauzalitate . De ce este așa?

Acest grafic ilustrează de ce corelația nu este același lucru cu cauzalitatea.

Sursa imaginii

Cercetătorii sunt adesea supuși unei presiuni mari să descopere date noi și utile. Deci tentația de a sări pistolul și de a trage concluzii prematur este mereu acolo. De aceea , este important în fiecare situație să cauți cauza și efectul real .

Utilizarea procentelor pentru a ascunde numerele și calculele

Un procentaj poate ascunde numerele exacte și poate face ca rezultatele să pară mai reputate și mai fiabile decât sunt.

De exemplu, dacă două din trei persoane preferă un anumit produs de curățare, ai putea spune că 66,667% dintre oameni preferă acel produs. Acest lucru face ca numărul să pară mai oficial, mai ales cu numerele de după virgulă zecimală incluse.

Iată câteva alte moduri prin care zecimale și procentele pot ascunde adevărul:

  • Ascunderea numerelor brute și a dimensiunilor mici ale eșantionului . Procentele ascund valoarea absolută a numerelor brute. Acest lucru le face utile pentru persoanele care doresc să ascundă numere nemăgulitoare sau rezultate de dimensiuni mici ale eșantionului.
  • Folosind baze diferite. Deoarece procentele nu oferă numerele originale pe care se bazează, poate fi ușor să distorsionați rezultatele. Dacă cineva ar dori să facă un număr să arate mai bine, ar putea calcula acel număr dintr-o bază diferită.

Acest lucru s-a întâmplat o dată într-un raport publicat de New York Times despre lucrătorii sindicali. Muncitorii au avut o reducere a salariului cu 20% într-un an, iar anul următor, Times a raportat că lucrătorii sindicali au primit o creștere de 5%. Așa că pretenția a fost că li s-a returnat un sfert din reducerea salariului.

Cu toate acestea, muncitorii au primit o creștere de 5% în funcție de salariul lor actual, nu de salariul pe care îl aveau înainte de reducerea salariului. Deci, deși arăta bine pe hârtie, reducerea cu 20% a salariului și creșterea cu 5% au fost calculate pe baza unor numere de bază diferite. Cele două numere nu se comparau deloc.

Culegerea cireșelor/Aruncarea datelor nefavorabile

Termenul „cules de cireșe” se bazează pe ideea de a culege numai cele mai bune fructe dintr-un copac. Oricine vede acel fruct este obligat să creadă că toate fructele de pe pom sunt la fel de sănătoase. Evident, nu este neapărat cazul.

Același principiu intră în joc și în cazul schimbărilor climatice. Multe diagrame își limitează cadrul de date pentru a arăta doar schimbările climatice din anii 2000 până în 2013.

Ca rezultat, se pare că schimbările de temperatură și anomaliile sunt consistente și nu se schimbă prea mult. Când faci un pas înapoi și te uiți la imaginea de ansamblu, devine clar unde sunt schimbările și anomaliile.

Acest lucru se întâmplă și în domeniul medicinei veterinare. Când veterinarii sunt rugați să prezinte rezultatele unui nou medicament de probă, ei tind să prezinte cele mai bune rezultate. În special dacă o companie farmaceutică susține studiul, ea vrea să vadă doar cele mai bune rezultate.

Datele tale frumoase merită să fie online

wpDataTables poate face așa. Există un motiv întemeiat pentru care este pluginul WordPress numărul 1 pentru crearea de tabele și diagrame receptive.

Un exemplu real de wpDataTables în sălbăticie

Și este foarte ușor să faci așa ceva:

  1. Dumneavoastră furnizați datele din tabel
  2. Configurați-l și personalizați-l
  3. Publicați-l într-o postare sau pagină

Și nu este doar frumos, ci și practic. Puteți crea tabele mari cu până la milioane de rânduri sau puteți utiliza filtre avansate și puteți căuta, sau puteți face sălbatic și îl puteți edita.

„Da, dar îmi place prea mult Excel și nu există așa ceva pe site-uri”. Da, există. Puteți utiliza formatarea condiționată, cum ar fi Excel sau Foi de calcul Google.

Ți-am spus că poți crea și diagrame cu datele tale? Și asta e doar o mică parte. Există o mulțime de alte funcții pentru tine.

Pescuitul de date

Pescuitul de date, cunoscut și sub numele de dragarea datelor, este analiza unor cantități mari de date cu scopul de a găsi o corelație. Cu toate acestea, așa cum sa discutat mai devreme în această postare, corelația nu implică cauzalitate. Insistând că rezultă doar statistici înșelătoare.

Puteți vedea în fiecare zi exemple de pescuit de date în domenii industriale. O săptămână este lansat un scandal despre data mining, iar o săptămână mai târziu este infirmat de un raport și mai scandalos.

O altă problemă cu acest tip de analiză a datelor este că oamenii aleg doar datele care susțin punctul lor de vedere și ignoră restul. Omitând informații contradictorii, ele fac ca rezultatele să pară mai convingătoare .

Etichete confuze ale graficelor și diagramelor

Când a început pandemia de COVID-19, mai mulți oameni ca niciodată au apelat la vizualizarea datelor despre răspândirea virusului. Oamenii care nu au trebuit niciodată să lucreze cu o reprezentare vizuală a statisticilor au fost aruncați brusc de la capătul adânc al datelor statistice.

În plus, organizațiile încercau adesea să obțină rapid informații despre oameni. Uneori, asta însemna sacrificarea unor statistici precise. Acest lucru a provocat o creștere a statisticilor înșelătoare și a interpretării greșite a datelor.

La aproximativ cinci luni după ce COVID-19 a început să se răspândească, Departamentul de Sănătate Publică din Georgia a publicat acest grafic:

Scopul graficului a fost să arate cele 5 țări cu cele mai mari cazuri de COVID în ultimele 15 zile și numărul de cazuri într-o perioadă de timp.

Această diagramă are câteva greșeli care îl fac ușor de înțeles greșit. Axa x, de exemplu, nu are o etichetă care să explice că reprezintă evoluția cazurilor în timp.

Mai rău, datele de pe grafic nu sunt organizate cronologic. Datele pentru aprilie și mai sunt împrăștiate în grafic pentru a face să pară că numărul de cazuri a scăzut constant. Fiecare țară este, de asemenea, listată astfel încât să pară că cazurile au scăzut.

Ulterior, au republicat graficul cu date și județe mai bine organizate:

Numere inexacte

Un alt exemplu de statistici înșelătoare vine sub forma unor numere inexacte. Observați această declarație dintr-o veche campanie Reebok.

Anunțul susține că pantoful lucrează cu 11% mai greu ischio-jambierii și gambele unei persoane și poate tonifica fesele unei persoane cu până la 28% mai mult decât alți pantofi sport . Tot ce trebuie să facă persoana este să meargă în pantofi sport.

Aceste cifre fac să pară că Reebok a făcut cercetări ample asupra beneficiilor pantofului.

Realitatea a fost că acele cifre erau complet inventate. Brandul a primit o penalizare pentru utilizarea unor astfel de statistici înșelătoare. De asemenea, au trebuit să schimbe declarația și să elimine numerele false.

Cum să evitați și să identificați utilizarea greșită a statisticilor

Statisticile au potențialul de a fi extrem de utile. Dar statisticile înșelătoare au și potențialul de a deruta și de a păcăli oamenii. Statisticile dau autoritate unei afirmații și îi convinge pe oameni să aibă încredere într-un anumit argument.

Statisticile solide și adevărate ajută să ofere oamenilor o perspectivă și să-i ajute să ia decizii. Dar statisticile înșelătoare sunt periculoase . În loc să-i ajute pe oameni să evite capcanele și gropile, ei îi conduc pe oameni direct în situațiile pe care doreau să le evite.

Dar este posibil să se identifice statistici și date înșelătoare. Când întâlniți o statistică, opriți-vă și puneți următoarele întrebări:

  • De unde provin aceste date?
  • Sursa este controlată? Sau este un experiment cu dimensiunea eșantionului?
  • Ce alți factori ar putea juca în acest rezultat?
  • Informația încearcă să mă informeze sau mă direcționează către o concluzie predeterminată?

Fie că colectați date, fie că vizualizați rezultatele cercetărilor altora, asigurați-vă că datele sunt corecte. În acest fel, nu contribuiți la răspândirea statisticilor înșelătoare .

Dacă ți-a plăcut să citești acest articol despre Statisticile înșelătoare, ar trebui să le citești și pe acestea:

  • Cea mai impresionantă vizualizare interactivă a datelor pe care o veți găsi online
  • Cele mai bune instrumente de vizualizare a datelor WordPress pe care le puteți găsi
  • Cele mai bune instrumente și platforme de vizualizare a datelor pentru dvs