Wprowadzające w błąd przykłady wizualizacji danych, których należy unikać
Opublikowany: 2022-07-27Wizualizacja danych jest niezbędnym narzędziem do analizy i przekazywania złożonego materiału danych . Musisz jednak być ostrożny. Jeśli zostanie to zrobione w niewłaściwy sposób, zniekształci lub błędnie przedstawi informacje.
Niestety, niektórzy używają wizualizacji danych, aby celowo przeinaczać dane . Mają agendę lub chcą promować własną opinię. Inne wprowadzające w błąd wizualizacje danych są wynikiem błędów lub braku zrozumienia sposobu prezentacji danych. Projekt może być piękny i atrakcyjny, ale nie nadaje się do jasnego przekazywania informacji.
Czasami myląca wizualizacja danych jest oczywista; czasami jest bardziej subtelny. Warto wiedzieć, jak wygląda dobra wizualizacja danych i jakie są najlepsze sposoby ich reprezentacji.
Ten artykuł pokaże Ci wprowadzające w błąd przykłady wizualizacji danych , które mogą dać Ci ważne lekcje.
Obcinanie skali
Wykresy słupkowe to jedne z najpopularniejszych przykładów wizualizacji danych. Daje szybkie wyobrażenie o względnym rozmiarze, porównując wysokości słupków. Są łatwe do wykonania i każdy je rozumie .
Wykres słupkowy w tym przykładzie porównuje przychody netto firmy Coca-Cola w ciągu ostatnich lat. Skala pionowa wynosi od 0 do 48 mld. To jest logiczne i poprawne. Oś Y w następnym przykładzie zaczyna się od 28 mld, co sprawia, że wzrost przychodów w kolejnych latach wygląda tak, jakby rozrósł się do stratosfery.
Wykres utworzony za pomocą wpDataTables
Odcięcie części osi pionowej podkreśla różnice w wielkości poszczególnych słupków. Niektórzy używają tej sztuczki, aby oszukać ludzi, aby założyli, że różnice w danych są większe niż są .
Wykres utworzony za pomocą wpDataTables
Oto kolejny przykład. Porównuje przychody Apple w poszczególnych regionach w latach 2017-2018. Na pierwszy rzut oka wydaje się, że Apple radziło sobie znacznie lepiej w Japonii niż w Europie.
Czy to prawda, czy jest to przykład słabej wizualizacji danych? Jeśli przyjrzysz się bliżej, zauważysz skrócenie osi Y. Powoduje to błędne przedstawienie danych.
Tak to właściwie powinno wyglądać:
Wykres utworzony za pomocą wpDataTables
Manipulacja osi Y
Dalsza manipulacja osią y prowadzi do większej liczby błędów w wizualizacji danych. Możesz pokazać całą oś pionową i nadal zmieniać ją w taki sposób, aby straciła wszelki sens. Jednym ze sposobów jest zmiana skali tak, aby nadmiernie podkreślała różnice w danych .
Ta zmiana osi jest bardzo częstym przykładem złej wizualizacji danych. Media społecznościowe są pełne tego przeinaczenia. Popycha fałszywe narracje.
Na przykład ktoś może przedstawić na wykresie niewielkie zmiany temperatury. Aby krzywa była jak najmniej znacząca , używają skali pionowej w zakresie od -10 °C do 100 °C. To powszechna sztuczka, by zaprzeczyć skutkom globalnego ocieplenia.
Małe zmiany mogą mieć duży wpływ i zmienić historię zestawu danych. Spójrz na te przykłady. Ocena kredytowa 634 z 700
nie wygląda tak samo, jak ocena kredytowa 634 na 850.
Ukrywanie odpowiednich danych
Kłamstwo na temat danych to zła rzecz. Ale jest to tak samo złe, jak pominięcie punktów danych, ponieważ nie odpowiadają one twoim celom.
Pomijanie niektórych danych skupia uwagę odbiorców na określonej części pozytywnych informacji . Odbywa się to kosztem dokładności i zrozumienia całej historii. Każdy punkt danych ma historię do opowiedzenia i może przekazywać ważne informacje. Jednak każdy punkt danych może wprowadzać w błąd, gdy nie ma odpowiedniego kontekstu.
Przeanalizuj kolejny przykład z listy mylących przykładów wizualizacji danych. W 2018 roku Pew Research Center opublikowało ankietę dotyczącą korzystania z mediów społecznościowych.
Zły przykład wizualizacji danych przesadnie podkreślałby fakt, że 68% Amerykanów korzysta z Facebooka.
Ten przykład pokazuje, jak ktoś może pominąć punkty danych, aby uzyskać inny obraz postępu wzrostu. Zauważysz płynniejszy wzrost, jeśli pokażesz punkty danych co drugi rok
zamiast co roku. Ale rzeczywistość tak nie wygląda.
Firmy wykorzystują tę mylącą wizualizację danych, pomijając duże wartości odstające w sprzedaży lub zysku. Sprawia to, że wygląda na to, że firma jest bardziej stabilna i przewidywalna niż jest. Maskuje prawdziwą kapryśność rynku. Kiedy tworzysz wizualizacje danych, upewnij się, że dajesz dostęp do wszystkich informacji.
Twoje piękne dane zasługują na to, by być online
wpDataTables może to zrobić. Nie bez powodu jest to wtyczka nr 1 WordPress do tworzenia responsywnych tabel i wykresów.
I naprawdę łatwo jest zrobić coś takiego:
- Podajesz dane tabeli
- Skonfiguruj i dostosuj go
- Opublikuj go w poście lub na stronie
I to nie tylko ładne, ale i praktyczne. Możesz tworzyć duże tabele z milionami wierszy lub korzystać z zaawansowanych filtrów i wyszukiwania, lub możesz zaszaleć i udostępnić je do edycji.
„Tak, ale po prostu za bardzo lubię Excela, a na stronach internetowych nic takiego nie ma”. Tak, jest. Możesz użyć formatowania warunkowego, takiego jak w Excelu lub Arkuszach Google.
Czy mówiłem ci, że możesz też tworzyć wykresy ze swoich danych? A to tylko niewielka część. Istnieje wiele innych funkcji dla Ciebie.
Korelacja i przyczynowość
Pokazywanie korelacji między danymi to dobry sposób, aby pomóc odbiorcom lepiej zrozumieć temat. Możesz to zrobić, tworząc nakładki zestawów danych na jednym wykresie. Połączenie wyjaśnień ustnych i wizualnych może pomóc widzom w nawiązaniu pewnych ważnych połączeń. Ostrzeżenie jest również na miejscu. Zbyt wiele nakładek zaciemnia informacje , zamiast podkreślać połączenia.
Wykres utworzony za pomocą wpDataTables
Gdy są używane w niewłaściwy sposób, nakładki mogą sugerować przyczyny, których nie ma. Oto dobrze znany przykład. Sugeruje to związek między konsumpcją lodów a brutalną przestępczością. W rzeczywistości oba są wynikiem ciepłej pogody.
Przyczynowość to nie to samo, co korelacja danych. Teraz, gdy zbiory danych stają się coraz większe, korelacja jest znacznie bardziej podkreślana. Łatwiej jest wykryć korelację niż ustalić prawdziwą przyczynowość między dwoma zjawiskami.
Istnieje ważny powód, dla którego przyczynowość nie jest równoznaczna z korelacją. Porównanie dwóch zmiennych może przesłonić obecność trzeciej zmiennej zakłócającej.
Nieznana trzecia zmienna może wpływać na dwie inne zmienne. Może to sugerować istnienie związku przyczynowego między nimi. Nikt nie może zdać sobie sprawy z obecności tej trzeciej zmiennej i nie można ustalić związku przyczynowego.
Zbieranie wiśni
Zbieranie wiśni jest jednym z wielu znanych przykładów mylących wizualizacji danych. Ten formularz wizualizacji danych pomija pewne źródła lub fragmenty informacji .
Celem jest pokazanie czystszego lub bardziej przewidywalnego zestawu wyników i wyodrębnienie nieistniejącego trendu lub wzorca. To nieuczciwe i nieobiektywne. Wyniki stają się niedokładne i niekompletne i nie przekazują rzeczywistej wiedzy.
Zbieranie wiśni to forma złej wizualizacji danych, często spotykana w branży farmaceutycznej. Dokładny przegląd może to wykazać w prezentacji wyników badań klinicznych. Przykładem mogą być leki przeciwdepresyjne. Staje się to jasne, porównując dane z wynikami finansowanych przez rząd badań tego samego leku.
Powyższy przykład pokazuje, jak niebezpieczna może być selekcja danych. Badanie kliniczne może ujawnić pewne subtelne zawiłości. Można je wyodrębnić tylko poprzez rozważenie danych bez domieszek.
Niejasne skalowanie logarytmiczne
Wartość między dwoma punktami na osi liniowej jest zawsze taka sama. W przypadku skali logarytmicznej. wartość między dwoma punktami różni się zgodnie z pewnym wzorem. To najłatwiejszy sposób, aby zobaczyć różnicę między skalą liniową a logarytmiczną.
Nie oznacza to, że reprezentacja logarytmiczna jest formą wprowadzającej w błąd wizualizacji danych. Może to być bardzo skuteczny sposób na wyodrębnienie ważnej relacji ze zbioru danych. Oczywiście ważne jest, aby pokazać, że wykres wykorzystuje skalę logarytmiczną. Jeśli tak nie jest, może to prowadzić do utraty znaczenia danych.
Poniższe dwa wykresy pokazują dwa sposoby prezentacji tych samych danych. Używa się skali liniowej,
podczas gdy druga wykorzystuje skalę logarytmiczną. Obie reprezentacje są w zasadzie poprawne, ale wyglądają inaczej.
Lekcja jest taka, że możesz użyć skali logarytmicznej, ale jakoś musisz to wyjaśnić widzowi .
Niekonwencjonalna wizualizacja
Elementy wizualizacji danych mają wpływ na psychikę człowieka . Kolory, czcionki i ikony mają pewne głębsze konotacje. Wpływają na sposób postrzegania informacji przez widza. Ignorowanie lub nadużywanie tych faktów to mylące przykłady wizualizacji danych.
Nie należy lekceważyć znaczenia wizualizacji danych. Kiedy mózg przyjmuje nowe informacje, potrzeba czasu na przeanalizowanie znaczenia niektórych elementów projektu.
Bycie kreatywnym jest dobre i może nadać znaczenie wizualizacji danych. Ale nie rozpraszaj publiczności nietypowymi zastosowaniami zwykłych skojarzeń wizualnych, jak w tym przykładzie
albo ten o śmierci z broni palnej.
Drugi przykład jest jednym z najgorszych, ponieważ jest oczywiste, co twórca próbuje powiedzieć pod powierzchnią. To niekonwencjonalne przedstawienie do góry nogami. Sprawia to wrażenie, że liczba zgonów z broni palnej na Florydzie spada, gdy jest odwrotnie.
Oto kolejny przykład. Pokazuje mapę Stanów Zjednoczonych ze wskaźnikami infekcji wirusowych na stan.
Pokazuje stawkę w różnych kolorach. Na podobnych mapach różne odcienie tego samego koloru pokazują koncentrację. Im ciemniejszy kolor, tym wyższy wskaźnik infekcji. Ta mapa nie jest zgodna z tą konwencją. Wynik jest bardzo mylący i może wprowadzać w błąd.
Wprowadzające w błąd wykresy kołowe
Jednym z najczęstszych przykładów mylących wizualizacji danych są wykresy kołowe. Z definicji pełny wykres kołowy zawsze przedstawia sumę 100% . Staje się to mylące lub mylące, jeśli chodzi o używanie wykresów kołowych do pokazywania wyników ankiet z więcej niż jedną odpowiedzią.
Przykład w tym wykresie jest poprawny.
Wykres utworzony za pomocą wpDataTables
Wartości procentowe na wykresie kołowym sumują się do 100%. Teraz wyobraź sobie ankietę, w której jedno z pytań pozwala kandydatom na więcej niż jedną odpowiedź. Na przykład „Gdzie byś się przeprowadził, aby uzyskać lepszą sytuację ekonomiczną?” Niektórzy mogą podać dwie odpowiedzi, na przykład Australia i Europa. Wtedy wykres kołowy już nie działa.
Gdyby ktoś użył tego typu wykresu, informacje stają się zniekształcone i niedokładne. W tym przypadku lepszym wyborem byłby diagram Venna.
Dane skumulowane a dane roczne
Reprezentacja skumulowana dodaje kolejne dane wejściowe. W takim przypadku wykres rośnie wraz z każdym punktem danych.
Dane roczne pokażą bezwzględne wyniki danych za dany rok. Wykres może iść w górę iw dół. W niektórych przypadkach może to być bardziej uczciwe przedstawienie wyników.
Wykres Worldometer COVID-19 służy do zilustrowania tego punktu.
I rzeczywiście, wykresy skumulowane były bardzo popularne w okresie pandemii.
Ponadto wiele firm wykorzystuje wykresy skumulowane, aby zaprezentować swoje wyniki. To sprawia, że wyniki sprzedaży wydają się lepsze niż są, ale nie daj się zwieść.
W 2013 roku dyrektor generalny Apple, Tim Cook, spotkał się z dużą krytyką, ponieważ wykorzystał wizualizację zbiorczych danych, aby pokazać sprzedaż iPada. Wiele osób uważało, że Apple próbował zatuszować spadającą sprzedaż swoich produktów.
Nie ma nic złego w wyświetlaniu zbiorczych reprezentacji danych, jeśli robisz to we właściwy sposób. Podkreśla na przykład zmiany we wzroście. Przed użyciem zastanów się, co chcesz pokazać i jakie wrażenie chcesz wywrzeć .
Zbyt wiele zmiennych
Tworząc projekt wizualnej reprezentacji danych, musisz podejmować ważne decyzje. Co uwzględniasz, a co wykluczasz? Chcesz być szczery , ale prezentacja również musi być przejrzysta . Im więcej masz danych i im ciekawsze szczegóły, tym trudniejsze decyzje.
To jest przykład, jak tego nie robić.
Wykres zawiera zbyt dużo informacji, a linie utrudniają rozróżnienie punktów danych. Możesz się nawet zastanawiać, czy projektant próbował ukryć niektóre dane. Jeśli taki był cel, może im się udało. W każdym razie wynik jest bezużyteczny.
Bliższa inspekcja wykazała, że wykres przedstawia liczbę i zakres egzaminowanych uczniów w długim okresie. Chodziło o to, że uczelnie przyjmowały więcej studentów z grup mniejszościowych i niższe dochody. Kontrola wykazała, że w tych grupach średnie wyniki wzrosły.
Rozpoczynając pracę nad wizualizacjami danych, najpierw zastanów się, co chcesz pokazać i jakich danych potrzebujesz, aby to osiągnąć. Liczba zmiennych danych określi, jakiego rodzaju wizualizacji danych użyjesz. Więc zadaj sobie pytanie, jaki format danych będzie najskuteczniejszy w jasnym komunikowaniu mojego punktu widzenia?
Niewłaściwe użycie grafiki 3D
Nie ma wątpliwości, że Twoi odbiorcy pokochają wykresy 3D. Należy jednak zachować ostrożność podczas korzystania z trójwymiarowych wizualizacji danych. Oto dlaczego.
Spójrz na ten przykład.
Jak widać po lewej, wykres 3D może zaciemniać dane , blokując inne części wykresu. Dzieje się tak, ponieważ wykres 3D naśladuje naturalną przestrzeń. Jest to problem, gdy nie pozwala na wizualny dostęp do ważnych punktów danych. Mogłoby to stworzyć fałszywe hierarchie i nacisk na pewne informacje.
Zniekształcenie to kolejna kwestia związana z trójwymiarowymi wizualizacjami danych. Jest to wynik skrótu perspektywicznego. Jest to powszechne na zdjęciach, ponieważ obiekty bliżej nas wydają się większe niż te daleko. Ale w wizualizacji danych jest to problem. Sprawia wrażenie nieistniejących hierarchii i zniekształca relacje danych.
Używanie niewłaściwego typu wykresu
Wykres kołowy działa najlepiej, gdy istnieją od dwóch do trzech elementów. To dobra liczba do rozróżnienia przez ludzkie oko. Większość ludzi będzie miała problemy ze zrozumieniem wykresu kołowego zawierającego cztery lub więcej elementów. Ten wykres kołowy stanowi przykład.
Wykres utworzony za pomocą wpDataTables
Który jest większy, Chiny czy Inny?
Określone typy danych proszą o określony typ wykresu. Niektóre typy wykresów są przydatne do prezentowania danych innego rodzaju. Próbując zastosować niewłaściwe podejście do wizualizacji, możesz wpaść w duże kłopoty.
W większości przypadków rodzaj danych, które posiadasz, determinuje sposób ich wizualizacji. Przede wszystkim zastanów się, czy Twoje dane są jakościowe (opisowe), czy ilościowe (miary). Informacje jakościowe nadają się do tworzenia wykresów kołowych i słupkowych. Do danych ilościowych najlepiej używać histogramów i wykresów.
Spójrz na ten przykład.
Pokazuje te same dane na wykresie kołowym i wykresie słupkowym. Wykres kołowy nie jest najlepszą opcją wizualizacji danych. Wykres słupkowy przedstawia liczby w dokładniejszy sposób. Dane w torcie zawsze sumują się do 100%, ale tutaj tak nie jest.
Nie używam adnotacji
Od Ciebie zależy, czy użyjesz adnotacji, czy nie. Nie jest to obowiązkowe , ale jest to dobra praktyka . Przyzwyczajaj się do robienia tego za każdym razem, gdy tworzysz wykres.
Osoby o różnym pochodzeniu będą patrzeć na Twoje wizualizacje danych. Niektórzy będą patrzeć tylko na wizualizacje, inni będą chcieli nieco więcej informacji. Mogą potrzebować tekstu i liczb, aby wyjaśnić swoje wątpliwości.
Oto przykład, który ilustruje tę kwestię.
Wykres utworzony za pomocą wpDataTables
Wszystko wygląda dobrze, a dane są poprawnie prezentowane. Ale kiedy spojrzysz na same dane, możesz się zastanawiać, dlaczego w 2019 r. nastąpił tak duży skok. Adnotacje mogą pomóc w wyjaśnieniu problemu.
Wnioski po tych mylących przykładach wizualizacji danych
Ludzie próbują manipulować i błędnie przedstawiać dane na wiele sposobów. 13 przykładów mylących wizualizacji danych przedstawionych powyżej to najczęstsze z nich.
Wyciągnij wnioski z błędów popełnionych przez innych ludzi. Postaraj się nie tworzyć takich samych, a Twoje pulpity nawigacyjne i prezentacje będą wolne od błędów. Pamiętaj, aby pamiętać o swoich odbiorcach i zastanowić się, co chcesz im powiedzieć.
Dzięki tej wiedzy możesz reprezentować dane we właściwy sposób i umożliwić innym dokonywanie bardziej świadomych wyborów.
Jeśli podobał Ci się ten artykuł o wprowadzających w błąd przykładach wizualizacji danych, powinieneś przeczytać również te:
- Najlepsze praktyki wizualizacji danych, które musisz znać
- Świetne przykłady palety kolorów wizualizacji danych do użycia
- Imponujące przykłady wizualizacji danych do sprawdzenia