Contoh Visualisasi Data yang Menyesatkan untuk Dijauhi

Diterbitkan: 2022-07-27

Visualisasi data adalah alat penting untuk menganalisis dan mengkomunikasikan materi data yang kompleks . Anda harus berhati-hati sekalipun. Ketika dilakukan dengan cara yang salah akan mendistorsi atau salah mengartikan informasi.

Sayangnya, beberapa menggunakan visualisasi data untuk salah mengartikan data dengan sengaja . Mereka memiliki agenda atau ingin mempromosikan pendapat mereka sendiri. Visualisasi data menyesatkan lainnya adalah hasil dari kesalahan atau kurangnya pemahaman tentang cara menyajikan data. Desainnya mungkin indah dan menarik tetapi tidak cocok untuk komunikasi informasi yang jelas.

Terkadang visualisasi data yang menyesatkan terlihat jelas; terkadang lebih halus. Sangat berguna untuk mengetahui seperti apa visualisasi data yang baik dan apa cara terbaik untuk merepresentasikan data.

Artikel ini akan menunjukkan kepada Anda contoh visualisasi data yang menyesatkan yang dapat memberi Anda pelajaran penting.

Pemotongan Skala

Bagan batang adalah beberapa contoh visualisasi data yang paling populer. Ini memberikan gambaran singkat tentang ukuran relatif dengan membandingkan ketinggian batang. Mereka mudah dibuat dan semua orang memahaminya .

Bagan batang dalam contoh ini membandingkan pendapatan bersih yang dimiliki Coca-Cola selama beberapa tahun terakhir. Skala vertikal berjalan dari 0 hingga 48 miliar. Itu logis dan benar. Sumbu Y dalam contoh berikut dimulai dari 28 miliar yang membuat pertumbuhan pendapatan tahun-tahun berikutnya terlihat seperti menggelembung ke stratosfer.

Bagan dibuat dengan wpDataTables

Memotong bagian dari sumbu vertikal menekankan perbedaan ukuran batang yang berbeda. Beberapa menggunakan trik ini untuk mengelabui orang agar berasumsi bahwa perbedaan data lebih besar daripada sebenarnya .

Bagan dibuat dengan wpDataTables

Berikut adalah contoh lain. Ini membandingkan pendapatan Apple per wilayah antara 2017 dan 2018. Sepintas, tampaknya kinerja Apple jauh lebih baik di Jepang daripada di Eropa.

Apakah itu benar, atau apakah ini contoh visualisasi data yang buruk? Jika Anda melihat lebih dekat, Anda akan melihat pemotongan sumbu Y. Hal ini mengakibatkan kesalahan penyajian data.

Ini adalah bagaimana seharusnya terlihat seperti:

Bagan dibuat dengan wpDataTables

Manipulasi Sumbu Y

Manipulasi lebih lanjut dari sumbu y menyebabkan lebih banyak kesalahan visualisasi data. Anda dapat menampilkan seluruh sumbu vertikal dan masih mengubahnya sedemikian rupa sehingga kehilangan semua makna. Salah satu caranya adalah dengan mengubah skala sehingga terlalu menekankan perbedaan data .

Perubahan sumbu ini adalah contoh yang sangat umum dari visualisasi data yang buruk. Media sosial penuh dengan misrepresentasi ini. Ini mendorong narasi palsu.

Misalnya, seseorang dapat mewakili perubahan suhu kecil dalam grafik. Untuk membuat kurva sekecil mungkin , mereka menggunakan skala vertikal mulai dari -10 °C hingga 100 °C. Itu adalah trik umum untuk menyangkal efek pemanasan global.

Perubahan kecil dapat memiliki efek besar dan mengubah cerita di balik kumpulan data. Lihatlah contoh-contoh ini. Skor kredit 634 dari 700

tidak terlihat sama dengan skor kredit 634 dari 850.

Menyembunyikan Data yang Relevan

Berbohong tentang data adalah hal yang buruk. Tetapi sama buruknya dengan meninggalkan titik data karena tidak sesuai dengan tujuan Anda.

Meninggalkan beberapa data memfokuskan perhatian audiens pada bagian tertentu dari informasi positif . Itu mengorbankan akurasi dan pemahaman cerita yang lengkap. Setiap titik data memiliki cerita untuk diceritakan dan dapat menyampaikan informasi penting. Namun, setiap titik data dapat menyesatkan bila tidak ada konteks yang relevan.

Analisis contoh berikut ini pada daftar contoh visualisasi data yang menyesatkan. Pada tahun 2018, Pew Research Center menerbitkan survei tentang penggunaan media sosial.

Contoh visualisasi data yang buruk akan terlalu menekankan fakta bahwa 68% orang Amerika menggunakan Facebook.

Contoh ini menunjukkan bagaimana seseorang dapat mengabaikan poin data untuk memberikan kesan yang berbeda tentang perkembangan pertumbuhan. Anda melihat pertumbuhan yang lebih mulus jika Anda menunjukkan poin data untuk setiap tahun kedua

Sumber gambar

bukannya setiap tahun. Tapi kenyataannya tidak seperti itu.

Perusahaan menggunakan visualisasi data yang menyesatkan ini dengan menghilangkan outlier besar dalam penjualan atau laba. Itu membuatnya terlihat seperti perusahaan lebih stabil dan dapat diprediksi daripada sebelumnya. Ini menutupi ketidakteraturan pasar yang sebenarnya. Saat Anda membuat visualisasi data, pastikan untuk memberikan akses ke semua informasi.

Data cantik Anda layak untuk online

wpDataTables dapat membuatnya seperti itu. Ada alasan bagus mengapa ini adalah plugin WordPress #1 untuk membuat tabel dan bagan responsif.

Contoh aktual wpDataTables di alam liar

Dan sangat mudah untuk melakukan sesuatu seperti ini:

  1. Anda memberikan data tabel
  2. Konfigurasikan dan sesuaikan
  3. Publikasikan di postingan atau halaman

Dan itu tidak hanya cantik, tetapi juga praktis. Anda dapat membuat tabel besar dengan hingga jutaan baris, atau Anda dapat menggunakan filter dan pencarian lanjutan, atau Anda dapat menjadi liar dan membuatnya dapat diedit.

"Ya, tapi saya sangat menyukai Excel dan tidak ada yang seperti itu di situs web". Ya, ada. Anda dapat menggunakan pemformatan bersyarat seperti di Excel atau Google Spreadsheet.

Apakah saya memberi tahu Anda bahwa Anda juga dapat membuat bagan dengan data Anda? Dan itu hanya sebagian kecil. Ada banyak fitur lain untuk Anda.

Korelasi dan Penyebab

Menampilkan korelasi antar data adalah cara yang baik untuk membantu audiens memahami topik dengan lebih baik. Anda dapat melakukan ini dengan membuat overlay kumpulan data dalam satu grafik. Kombinasi penjelasan lisan dan visual dapat membantu pemirsa untuk membuat koneksi penting tertentu. Peringatan juga ada. Terlalu banyak overlay yang mengaburkan informasi daripada menyoroti koneksi.

Bagan dibuat dengan wpDataTables

Ketika digunakan dengan cara yang salah, overlay dapat menyiratkan penyebab yang sebenarnya tidak ada. Berikut adalah contoh yang terkenal. Ini menunjukkan hubungan antara konsumsi es krim dan kejahatan kekerasan. Pada kenyataannya, keduanya adalah hasil dari cuaca yang hangat.

Sebab-akibat tidak sama dengan korelasi dalam data. Sekarang set data menjadi lebih besar dan lebih besar, korelasi jauh lebih ditekankan. Lebih mudah untuk mendeteksi korelasi daripada membangun kausalitas sejati antara dua fenomena.

Ada alasan penting mengapa sebab-akibat tidak sama dengan korelasi. Membandingkan dua variabel dapat mengaburkan keberadaan variabel pengganggu ketiga.

Variabel ketiga yang tidak diketahui dapat mempengaruhi dua variabel lainnya. Ini mungkin memberi kesan adanya hubungan sebab akibat antara keduanya. Tidak seorang pun mungkin menyadari kehadiran variabel ketiga itu dan tidak mungkin untuk menetapkan sebab-akibat.

Memetik Ceri

Memetik ceri adalah salah satu dari banyak contoh visualisasi data menyesatkan yang diketahui. Bentuk visualisasi data ini menghilangkan sumber atau potongan informasi tertentu .

Tujuannya adalah untuk menunjukkan rangkaian hasil yang lebih bersih atau lebih dapat diprediksi dan mengekstrak tren atau pola yang tidak ada. Itu tidak jujur ​​dan tidak objektif. Hasilnya menjadi tidak akurat dan tidak lengkap serta tidak menyampaikan pengetahuan yang sebenarnya.

Memetik ceri adalah bentuk visualisasi data yang buruk yang sering terlihat di industri farmasi. Tinjauan yang cermat dapat menunjukkannya dalam penyajian hasil uji klinis. Contohnya adalah antidepresan. Ini menjadi jelas dengan membandingkan data dengan hasil investigasi yang didanai pemerintah dari obat yang sama.

Contoh di atas menunjukkan betapa berbahayanya pengambilan ceri data. Sebuah uji klinis dapat mengungkapkan kompleksitas halus tertentu. Ini hanya dapat diekstraksi dengan mempertimbangkan data yang tidak tercemar.

Penskalaan Logaritma Tidak Jelas

Nilai antara dua titik pada sumbu linier selalu sama. Dalam kasus skala logaritmik. nilai antara dua titik berbeda menurut pola tertentu. Itulah cara termudah untuk melihat perbedaan antara skala linier dan logaritmik.

Itu tidak berarti bahwa representasi logaritmik adalah bentuk visualisasi data yang menyesatkan. Ini bisa menjadi cara yang sangat efektif untuk mengekstraksi hubungan penting dalam kumpulan data. Tentu saja, penting untuk menunjukkan bahwa grafik tersebut menggunakan skala logaritmik. Jika bukan itu masalahnya, itu dapat menyebabkan hilangnya signifikansi data.

Dua grafik di bawah ini menunjukkan dua cara untuk menyajikan data yang sama. Satu menggunakan skala linier,

Sumber gambar

sedangkan yang lainnya menggunakan skala logaritmik. Kedua representasi itu, pada dasarnya, benar, tetapi terlihat berbeda.

Pelajarannya adalah Anda dapat menggunakan skala logaritmik, tetapi entah bagaimana Anda harus menjelaskannya kepada pemirsa .

Visualisasi Tidak Biasa

Elemen visualisasi data berpengaruh pada psikologi manusia . Warna, font, dan ikon semuanya memiliki konotasi tertentu yang lebih dalam. Mereka mempengaruhi cara pemirsa melihat informasi. Mengabaikan atau menyalahgunakan fakta ini adalah contoh visualisasi data yang menyesatkan.

Pentingnya visualisasi data tidak boleh diremehkan. Ketika otak menerima informasi baru, dibutuhkan waktu untuk menganalisis makna elemen desain tertentu.

Menjadi kreatif itu baik dan dapat menambah makna pada visualisasi data. Tapi jangan mengalihkan perhatian penonton dengan aplikasi yang tidak biasa dari asosiasi visual biasa seperti dalam contoh ini

atau yang ini tentang kematian senjata.

Sumber gambar

Contoh kedua adalah salah satu contoh terburuk karena jelas apa yang coba dikatakan pembuatnya di bawah permukaan. Ini adalah representasi terbalik yang tidak konvensional. Ini memberi kesan bahwa kematian akibat senjata sedang menurun di Florida padahal yang terjadi adalah sebaliknya.

Berikut adalah contoh lain. Ini menunjukkan peta Amerika Serikat dengan tingkat infeksi virus per negara bagian.

Sumber gambar

Ini menunjukkan tingkat dengan warna yang berbeda. Dalam peta serupa, nuansa berbeda dengan warna yang sama menunjukkan konsentrasi. Semakin gelap warnanya, semakin tinggi tingkat infeksinya. Peta ini tidak mengikuti konvensi ini. Hasilnya sangat membingungkan dan mungkin menyesatkan.

Diagram Pai yang Menyesatkan

Salah satu yang paling umum, dalam hal contoh visualisasi data yang menyesatkan, adalah diagram lingkaran. Menurut definisi, diagram lingkaran lengkap selalu mewakili total 100% . Ini menjadi membingungkan atau menyesatkan ketika menggunakan diagram lingkaran untuk menampilkan hasil survei dengan lebih dari satu jawaban.

Contoh dalam bagan ini benar.

Bagan dibuat dengan wpDataTables

Persentase dalam diagram lingkaran bertambah hingga 100%. Sekarang bayangkan sebuah survei di mana salah satu pertanyaan memungkinkan kandidat lebih dari satu jawaban. Misalnya, “Ke mana Anda akan pindah untuk situasi ekonomi yang lebih baik?” Beberapa mungkin memberikan dua jawaban, misalnya, Australia dan Eropa. Kemudian diagram lingkaran tidak berfungsi lagi.

Jika seseorang akan menggunakan jenis bagan ini, informasi menjadi terdistorsi dan tidak akurat. Diagram Venn akan menjadi pilihan yang lebih baik dalam kasus ini.

Data Kumulatif vs. Tahunan

Representasi kumulatif menambahkan input yang berurutan. Dalam hal ini, grafik naik dengan setiap titik data.

Data tahunan akan menunjukkan hasil data absolut untuk tahun tertentu. Grafiknya bisa naik turun. Dalam beberapa kasus, ini mungkin merupakan representasi hasil yang lebih jujur.

Grafik Worldometer COVID-19 berfungsi untuk menggambarkan hal ini.

Dan memang, grafik kumulatif sangat populer selama masa pandemi.

Juga, banyak perusahaan menggunakan grafik kumulatif untuk memamerkan hasil mereka. Itu membuat hasil penjualan tampak lebih baik daripada yang sebenarnya, tetapi jangan biarkan mereka menipu Anda.

Pada tahun 2013, CEO Apple, Tim Cook, mendapat banyak kritik karena menggunakan visualisasi data kumulatif untuk menunjukkan penjualan iPad. Banyak pihak yang merasa Apple berusaha menutupi penurunan penjualan produknya.

Tidak ada salahnya menampilkan representasi data kumulatif jika Anda melakukannya dengan cara yang benar. Ini menyoroti, misalnya, perubahan dalam pertumbuhan. Sebelum menggunakannya, pikirkan apa yang ingin Anda tampilkan dan kesan apa yang ingin Anda berikan .

Terlalu Banyak Variabel

Anda perlu membuat keputusan besar saat membuat desain untuk representasi data visual. Apa yang Anda sertakan dan apa yang Anda kecualikan? Anda ingin jujur ,   tapi penyajiannya juga harus jelas . Semakin banyak data yang Anda miliki dan semakin menarik detailnya, semakin sulit keputusannya.

Ini adalah contoh bagaimana tidak melakukannya.

Grafik berisi terlalu banyak informasi dan garis membuat sulit untuk membedakan titik data apa pun. Anda bahkan mungkin bertanya-tanya apakah perancang mencoba mengaburkan beberapa data. Jika itu tujuannya, mereka mungkin berhasil dengan baik. Bagaimanapun, hasilnya tidak berguna.

Pemeriksaan lebih dekat menunjukkan bahwa grafik tersebut mewakili jumlah dan jangkauan siswa ujian dalam jangka waktu yang lama. Intinya adalah bahwa universitas menerima lebih banyak siswa dari kelompok minoritas dan berpenghasilan rendah. Pemeriksaan menunjukkan bahwa dalam kelompok-kelompok ini skor rata-rata meningkat.

Saat Anda mulai mengerjakan visualisasi data, pertama-tama pikirkan apa yang ingin Anda tampilkan dan data apa yang Anda perlukan untuk mencapainya. Jumlah variabel data akan menentukan jenis visualisasi data yang akan Anda gunakan. Jadi tanyakan pada diri Anda, format data apa yang paling efektif untuk menyampaikan maksud saya dengan jelas?

Penggunaan Grafik 3D yang Salah

Tidak ada keraguan bahwa audiens Anda akan menyukai grafik 3D. Namun Anda perlu berhati-hati saat menggunakan visualisasi data tiga dimensi. Inilah alasannya.

Lihatlah contoh ini.

Sumber gambar

Seperti yang Anda lihat di sebelah kiri, grafik 3D dapat mengaburkan data dengan memblokir bagian lain dari grafik. Ini karena grafik 3D meniru ruang alami. Ini adalah masalah ketika tidak memungkinkan akses visual ke titik data penting. Ini bisa menciptakan hierarki palsu dan penekanan pada bagian informasi tertentu.

Distorsi adalah masalah lain yang terkait dengan visualisasi data tiga dimensi. Ini adalah hasil dari foreshortening. Ini biasa terjadi pada gambar karena objek yang lebih dekat dengan kita tampak lebih besar daripada yang jauh. Namun dalam visualisasi data, ini menjadi masalah. Ini memberi kesan hierarki yang tidak ada dan mencondongkan hubungan data.

Menggunakan Jenis Bagan yang Salah

Diagram lingkaran berfungsi paling baik bila ada dua hingga tiga item. Itu adalah angka yang bagus untuk dibedakan oleh mata manusia. Kebanyakan orang akan kesulitan memahami diagram lingkaran dengan empat item atau lebih. Diagram lingkaran ini mencontohkan intinya.

Bagan dibuat dengan wpDataTables

Mana yang lebih besar, China atau Lainnya?

Tipe data tertentu meminta tipe bagan tertentu. Jenis bagan tertentu berguna untuk menyajikan data dari jenis yang berbeda. Anda dapat mengalami masalah besar saat mencoba menggunakan pendekatan visualisasi yang salah.

Sebagian besar waktu jenis data yang Anda miliki menentukan cara Anda memvisualisasikannya. Pertama-tama, pertimbangkan apakah data Anda kualitatif (deskriptif) atau kuantitatif (ukuran). Informasi kualitatif cocok untuk diagram lingkaran dan batang. Cara terbaik adalah menggunakan histogram dan grafik untuk data kuantitatif.

Lihatlah contoh ini.

Ini menunjukkan data yang sama dalam diagram lingkaran dan diagram batang. Diagram lingkaran bukanlah opsi visualisasi data terbaik. Bagan batang mewakili angka dengan cara yang lebih akurat. Data dalam pai selalu bertambah hingga 100%, tetapi tidak demikian halnya di sini.

Tidak Menggunakan Anotasi

Terserah Anda untuk menggunakan anotasi atau tidak. Hal ini tidak wajib untuk melakukannya , tetapi itu adalah praktik yang baik . Biasakan untuk melakukannya setiap kali Anda membuat grafik.

Orang dengan latar belakang berbeda akan melihat visualisasi data Anda. Beberapa hanya akan melihat visualnya, yang lain ingin sedikit lebih banyak informasi. Mereka mungkin membutuhkan teks dan nomor untuk memperjelas keraguan yang mereka miliki.

Berikut adalah contoh yang menggambarkan intinya.

Bagan dibuat dengan wpDataTables

Semuanya terlihat bagus dan data disajikan dengan benar. Namun, ketika Anda melihat data itu sendiri, Anda mungkin bertanya-tanya mengapa ada lonjakan besar pada tahun 2019. Anotasi dapat membantu Anda mengklarifikasi masalah tersebut.

Kesimpulan Setelah Contoh Visualisasi Data Menyesatkan Ini

Ada banyak cara di mana orang mencoba untuk memanipulasi dan salah mengartikan data. 13 contoh visualisasi data yang menyesatkan di atas merupakan contoh yang paling umum.

Belajarlah dari kesalahan yang dilakukan orang lain. Bertekadlah untuk tidak membuat yang sama dan dasbor serta presentasi Anda akan bebas dari kesalahan. Ingatlah untuk mengingat audiens Anda dan pikirkan apa yang ingin Anda sampaikan kepada mereka.

Dengan pengetahuan ini, Anda dapat merepresentasikan data dengan cara yang benar dan memungkinkan orang lain untuk membuat pilihan yang lebih tepat.

Jika Anda senang membaca artikel ini tentang contoh visualisasi data yang menyesatkan, Anda juga harus membaca ini:

  • Praktik Terbaik Visualisasi Data yang Perlu Anda Ketahui
  • Contoh Palet Warna Visualisasi Data Hebat untuk Digunakan
  • Contoh visualisasi data yang mengesankan untuk dilihat