Statistik yang Menyesatkan Bisa Berbahaya (Beberapa Contoh)
Diterbitkan: 2022-12-06Orang mengandalkan statistik untuk mendapatkan informasi penting. Dalam dunia bisnis, statistik berguna untuk melacak tren, dan memaksimalkan produktivitas. Namun terkadang statistik dapat disajikan dengan cara yang menyesatkan . Misalnya, pada tahun 2007 Advertising Standards Authority (ADA) di Inggris menerima keluhan tentang iklan Colgate.
Iklan terkenal mengklaim bahwa 80% dokter gigi merekomendasikan penggunaan pasta gigi Colgate. Keluhan yang diterima ADA berpendapat bahwa ini adalah pelanggaran aturan periklanan di Inggris Raya. Setelah menyelidiki masalah tersebut, ADA menemukan bahwa iklan tersebut menggunakan statistik yang menyesatkan.
Memang benar banyak dokter gigi yang merekomendasikan pasta gigi Colgate. Tapi tidak semuanya mengutip Colgate sebagai rekomendasi nomor satu mereka. Sebagian besar dokter gigi merekomendasikan pasta gigi jenis lain juga, dan Colgate biasanya muncul di kemudian hari.
Ini hanyalah salah satu contoh bagaimana statistik yang menyesatkan digunakan. Orang-orang menemukan contoh statistik yang menyesatkan di berbagai bidang kehidupan. Anda dapat menemukan contoh dalam berita, iklan, politik, dan bahkan sains.
Posting ini akan membantu Anda belajar mengenali statistik menyesatkan dan data menyesatkan lainnya . Ini akan membahas bagaimana data ini menyesatkan orang. Anda juga akan belajar kapan dan bagaimana menggunakan data saat membuat keputusan penting.
Apa itu Statistik yang Menyesatkan?
Statistik adalah hasil dari mengumpulkan data numerik, menganalisisnya dengan hati-hati, dan kemudian menafsirkannya . Ini sangat berguna untuk memiliki statistik jika Anda berurusan dengan data dalam jumlah besar, tetapi apa pun yang dapat diukur dapat menjadi statistik. Statistik sering mengungkapkan banyak hal tentang dunia dan cara kerjanya.
Namun, ketika informasi itu disalahgunakan, bahkan secara tidak sengaja, itu menjadi statistik yang menyesatkan. Statistik yang menyesatkan memberi orang informasi palsu yang menipu mereka daripada memberi tahu mereka .
Ketika orang mengambil statistik di luar konteks, itu kehilangan nilainya dan dapat menyebabkan orang menarik kesimpulan yang salah. Istilah "statistik yang menyesatkan" menjelaskan metode statistik apa pun yang merepresentasikan data secara tidak benar. Disengaja atau tidak , itu tetap dianggap sebagai statistik yang menyesatkan.
Saat mengumpulkan data untuk statistik, ada tiga poin prinsip yang perlu diingat. Masalah dengan analisis data dapat terjadi selama salah satu poin ini.
- Pengumpulan: Saat mengumpulkan data
- Pemrosesan: Saat menganalisis data dan implikasinya
- Presentasi: Saat berbagi temuan Anda dengan orang lain
Ukuran Sampel Kecil
Survei ukuran sampel adalah salah satu contoh pembuatan statistik yang menyesatkan. Survei atau studi yang dilakukan pada audiens ukuran sampel sering menghasilkan hasil yang sangat menyesatkan sehingga tidak dapat digunakan.
Sebagai ilustrasi, sebuah survei menanyakan 20 orang pertanyaan ya-atau-tidak. 19 orang menjawab ya untuk survei. Jadi hasilnya menunjukkan bahwa 95% orang akan menjawab ya untuk pertanyaan itu. Tapi ini bukan survei yang bagus karena informasinya terbatas.
Statistik ini tidak memiliki nilai nyata. Sekarang jika Anda mengajukan pertanyaan yang sama kepada 1.000 orang dan 950 menjawab ya, maka itu adalah statistik yang jauh lebih andal untuk menunjukkan bahwa 95% orang akan menjawab ya.
Untuk melakukan studi ukuran sampel yang andal, Anda perlu mempertimbangkan tiga hal:
- Satu : Pertanyaan apa yang Anda tanyakan?
- Dua : Apa pentingnya statistik yang Anda coba temukan?
- Dan tiga : Teknik statistik apa yang akan Anda gunakan?
Untuk mendapatkan hasil yang dapat diandalkan, analisis kuantitatif ukuran sampel apa pun harus mencakup setidaknya 200 orang.
Pertanyaan yang Dimuat
Penting untuk mencari data dari sumber yang netral . Kalau tidak, informasinya miring. Pertanyaan yang dimuat menggunakan asumsi yang kontroversial atau tidak dapat dibenarkan untuk memanipulasi respons. Salah satu contohnya adalah mengajukan pertanyaan yang dimulai dengan, "Apa yang Anda sukai." Pertanyaan ini berhasil mengumpulkan umpan balik positif tetapi gagal mengajari Anda sesuatu yang berguna. Itu tidak memberikan kesempatan bagi orang tersebut untuk memberikan pemikiran dan pendapat jujur mereka.
Pertimbangkan perbedaan dalam dua pertanyaan berikut:
- Apakah Anda mendukung reformasi pajak yang akan menyiratkan pajak yang lebih tinggi?
- Apakah Anda mendukung reformasi pajak yang akan bermanfaat bagi redistribusi sosial?
Pertanyaannya pada dasarnya berhubungan dengan subjek yang sama, tetapi hasil dari masing-masing pertanyaan ini akan sangat berbeda. Polling harus dilakukan dengan cara yang tidak memihak dan tidak memihak. Anda ingin mendapatkan pendapat jujur orang-orang dan gambaran lengkap tentang apa yang orang pikirkan. Untuk mencapai itu, pertanyaan Anda tidak boleh menyiratkan jawaban atau memancing respons emosional .
Mengutip “Rata-Rata” yang Menyesatkan
Beberapa orang menggunakan istilah "rata-rata" untuk mengaburkan kebenaran atau kebohongan agar informasi terlihat lebih baik.
Teknik ini sangat berguna jika seseorang ingin membuat angka tampak lebih besar atau lebih baik dari aslinya. Misalnya, sebuah universitas yang ingin menarik mahasiswa baru dapat memberikan gaji tahunan “rata-rata” untuk lulusan dari sekolah mereka. Tapi mungkin hanya segelintir mahasiswa yang benar-benar bergaji tinggi. Tapi gaji mereka membuat penghasilan rata-rata untuk semua siswa lebih tinggi. Itu terlihat lebih baik untuk keseluruhan rata-rata.
Rata-rata juga berguna untuk menyembunyikan ketimpangan. Sebagai contoh lain, misalkan sebuah perusahaan membayar $20.000 setahun kepada 90 karyawannya. Tapi bos mereka menerima $200.000 setahun. Jika Anda menggabungkan gaji bos dan gaji karyawan, pendapatan rata-rata untuk setiap anggota perusahaan adalah $21.978.
Di atas kertas, itu terlihat bagus. Tetapi angka itu gagal menceritakan keseluruhan cerita karena salah satu karyawan (bos) berpenghasilan jauh lebih banyak daripada pekerja lainnya. Jadi hasil seperti ini dihitung sebagai statistik yang menyesatkan.
Data Kumulatif vs. Tahunan
Data kumulatif melacak informasi pada grafik dari waktu ke waktu. Setiap kali Anda memasukkan data ke dalam grafik, grafik naik.
Data tahunan menyajikan semua data untuk tahun tertentu.
Informasi pelacakan untuk setiap tahun memberikan gambaran yang lebih benar tentang tren umum.
Salah satu contoh grafik kumulatif adalah grafik Worldometer COVID-19. Selama pandemi COVID-19, banyak contoh grafik kumulatif yang terpotong. Mereka sering mencerminkan jumlah kumulatif kasus COVID di area tertentu.
Beberapa perusahaan menggunakan grafik seperti ini untuk membuat penjualan tampak lebih besar dari yang sebenarnya. Pada 2013, CEO Apple Tim Cook menerima kritik karena menggunakan presentasi yang hanya menunjukkan jumlah kumulatif penjualan iPhone. Banyak orang pada saat itu merasa dia sengaja melakukan ini untuk menyembunyikan fakta bahwa penjualan iPhone semakin berkurang.
Ini bukan untuk mengatakan bahwa semua data kumulatif buruk atau salah. Faktanya, ini berguna untuk melacak perubahan atau pertumbuhan dan berbagai total. Namun yang penting adalah memperhatikan perubahan data. Kemudian lihat lebih dalam apa yang menyebabkannya daripada mengandalkan bagan untuk memberi tahu Anda segalanya.
Overgeneralisasi dan Sampel Bias
Generalisasi berlebihan terjadi ketika seseorang menganggap bahwa apa yang benar untuk satu orang pasti benar untuk orang lain. Biasanya fallacy ini terjadi ketika seseorang melakukan penelitian dengan sekelompok orang tertentu. Mereka kemudian berasumsi bahwa hasilnya akan berlaku untuk kelompok orang lain yang tidak terkait.
Sampel yang tidak representatif, atau sampel yang bias, adalah survei yang tidak mewakili populasi umum secara akurat.
Salah satu contoh sampel yang bias terjadi pada pemilihan presiden tahun 1936 di Amerika Serikat.
The Literary Digest, majalah populer saat itu, melakukan survei untuk memprediksi siapa yang akan memenangkan pemilu. Hasilnya memprediksi bahwa Alfred Landon akan menang telak.
Majalah ini dikenal akurat memprediksi hasil pemilu. Tahun ini, bagaimanapun, mereka benar-benar salah. Franklin Roosevelt menang dengan suara hampir dua kali lipat dari lawannya.
Beberapa penelitian lebih lanjut mengungkapkan bahwa ada dua variabel yang memengaruhi hasil.
Pertama , sebagian besar peserta survei adalah orang-orang yang ditemukan di buku telepon dan daftar pendaftaran otomatis. Jadi survei hanya dilakukan dengan orang-orang dari status sosial ekonomi tertentu.
Faktor kedua adalah mereka yang memilih Landon lebih bersedia menanggapi survei daripada mereka yang memilih Roosevelt. Jadi hasilnya mencerminkan bias itu.
Memotong Axis
Memotong sumbu pada grafik adalah contoh lain dari statistik yang menyesatkan. Pada sebagian besar grafik statistik, sumbu x dan y mungkin dimulai dari nol. Tetapi memotong sumbu berarti grafik sebenarnya memulai sumbu pada beberapa nilai lain. Ini memengaruhi tampilan grafik, dan memengaruhi kesimpulan yang akan ditarik seseorang.
Berikut adalah salah satu contoh yang menggambarkan hal ini:
Contoh lain dari hal ini terjadi baru-baru ini pada September 2021. Di salah satu siaran Fox News, pembawa acara menggunakan bagan yang menunjukkan jumlah orang Amerika yang mengaku Kristen. Bagan tersebut menunjukkan bahwa jumlah orang Amerika yang diidentifikasi sebagai orang Kristen telah menurun drastis selama 10 tahun terakhir.
Dalam grafik berikut, kita melihat bahwa pada tahun 2009 77% orang Amerika diidentifikasi sebagai orang Kristen.
Pada 2019, jumlahnya menurun menjadi 65%. Pada kenyataannya, itu bukanlah penurunan yang besar. Tetapi sumbu pada bagan ini dimulai pada 58% dan berhenti pada 78%. Jadi penurunan 12% dari 2009 ke 2019 tampak jauh lebih drastis dari yang sebenarnya.
Penyebab dan Korelasi
Mudah untuk mengasumsikan koneksi antara dua titik data yang tampaknya terhubung. Namun dikatakan bahwa korelasi tidak menyiratkan sebab -akibat. Kenapa begitu?
Grafik ini menggambarkan mengapa korelasi tidak sama dengan sebab-akibat.
Peneliti sering berada di bawah banyak tekanan untuk menemukan data baru yang berguna. Jadi godaan untuk melompat-lompat dan menarik kesimpulan sebelum waktunya selalu ada. Itulah mengapa penting dalam setiap situasi untuk mencari sebab dan akibat yang sebenarnya .
Menggunakan Persentase untuk Menyembunyikan Angka dan Perhitungan
Persentase dapat menyembunyikan angka pasti dan membuat hasil tampak lebih bereputasi dan dapat diandalkan daripada yang sebenarnya.
Misalnya, jika dua dari tiga orang lebih menyukai produk pembersih tertentu, Anda dapat mengatakan bahwa 66,667% orang lebih menyukai produk tersebut. Hal ini membuat angka terlihat lebih resmi, terutama dengan menyertakan angka setelah titik desimal.
Berikut adalah beberapa cara lain desimal dan persentase dapat mengaburkan kebenaran:
- Menyembunyikan angka mentah dan ukuran sampel kecil . Persentase mengaburkan nilai absolut dari angka mentah. Ini membuatnya berguna bagi orang yang ingin menyembunyikan angka yang tidak menarik atau hasil ukuran sampel yang kecil.
- Menggunakan basis yang berbeda. Karena persentase tidak memberikan angka asli yang menjadi dasarnya, mudah untuk mendistorsi hasil. Jika seseorang ingin membuat satu angka terlihat lebih baik, mereka dapat menghitung angka tersebut dari basis yang berbeda.
Ini terjadi sekali dalam sebuah laporan yang dirilis New York Times tentang serikat pekerja. Para pekerja mendapat pemotongan gaji 20% satu tahun, dan tahun berikutnya Times melaporkan bahwa serikat pekerja menerima kenaikan gaji 5%. Jadi klaimnya adalah bahwa mereka mendapatkan seperempat dari potongan gaji mereka dikembalikan kepada mereka.
Namun, para pekerja menerima kenaikan 5% berdasarkan upah mereka saat ini, bukan upah yang mereka terima sebelum pemotongan gaji. Jadi meskipun terlihat bagus di atas kertas, pemotongan gaji 20% dan kenaikan gaji 5% dihitung dari angka dasar yang berbeda. Kedua angka itu tidak benar-benar sebanding sama sekali.
Cherry Picking / Membuang Data yang Tidak Menguntungkan
Istilah "petik ceri" didasarkan pada gagasan memetik hanya buah terbaik dari pohon. Siapa pun yang melihat buah itu pasti mengira semua buah di pohon itu sama sehatnya. Jelas, itu belum tentu demikian.
Prinsip yang sama berlaku dalam kasus perubahan iklim. Banyak bagan membatasi kerangka datanya hanya untuk menunjukkan perubahan iklim dari tahun 2000 hingga 2013.
Hasilnya, perubahan suhu dan anomali tampak konsisten dan tidak banyak berubah. Namun, ketika Anda mundur selangkah dan melihat gambaran besarnya, menjadi jelas di mana letak perubahan dan anomalinya.
Hal ini juga terjadi di bidang kedokteran hewan. Ketika dokter hewan diminta untuk mempresentasikan hasil dari obat percobaan baru, mereka cenderung memberikan hasil terbaik. Terutama jika perusahaan farmasi mendukung uji coba tersebut, mereka hanya ingin melihat hasil terbaik.
Data cantik Anda layak untuk online
wpDataTables bisa membuatnya seperti itu. Ada alasan bagus mengapa ini adalah plugin WordPress #1 untuk membuat tabel dan bagan yang responsif.
Dan sangat mudah untuk melakukan sesuatu seperti ini:
- Anda memberikan data tabel
- Konfigurasikan dan sesuaikan
- Publikasikan dalam postingan atau halaman
Dan itu tidak hanya cantik, tetapi juga praktis. Anda dapat membuat tabel besar dengan jutaan baris, atau Anda dapat menggunakan filter dan pencarian lanjutan, atau Anda dapat membuatnya menjadi dapat diedit.
“Ya, tapi saya terlalu menyukai Excel dan tidak ada yang seperti itu di situs web”. Ya, ada. Anda dapat menggunakan pemformatan bersyarat seperti di Excel atau Google Sheets.
Apakah saya memberi tahu Anda bahwa Anda juga dapat membuat bagan dengan data Anda? Dan itu hanya sebagian kecil. Ada banyak fitur lain untuk Anda.
Memancing Data
Penangkapan data, juga dikenal sebagai pengerukan data, adalah analisis data dalam jumlah besar dengan tujuan menemukan korelasi. Namun, seperti yang dibahas sebelumnya dalam posting ini, korelasi tidak menyiratkan sebab-akibat. Bersikeras bahwa itu hanya menghasilkan statistik yang menyesatkan.
Anda dapat melihat contoh pengambilan data di bidang industri setiap hari. Satu minggu skandal dirilis tentang penambangan data, dan seminggu kemudian dibantah oleh laporan yang bahkan lebih keterlaluan.
Masalah lain dengan analisis data semacam ini adalah orang hanya memilih data yang mendukung pandangan mereka dan mengabaikan yang lainnya. Dengan menghilangkan informasi yang kontradiktif, mereka membuat hasilnya terlihat lebih meyakinkan .
Label Bagan dan Grafik yang Membingungkan
Saat pandemi COVID-19 dimulai, semakin banyak orang beralih ke visualisasi data penyebaran virus. Orang-orang yang tidak pernah harus bekerja dengan representasi visual statistik tiba-tiba terlempar jauh dari data statistik.
Selain itu, organisasi sering mencoba mendapatkan informasi orang dengan cepat. Terkadang itu berarti mengorbankan statistik yang akurat. Hal ini menyebabkan lonjakan statistik yang menyesatkan dan salah tafsir data.
Sekitar lima bulan setelah COVID-19 mulai menyebar, Departemen Kesehatan Masyarakat Georgia AS merilis bagan ini:
Tujuan grafik adalah untuk menunjukkan 5 negara dengan kasus COVID tertinggi selama 15 hari sebelumnya, dan jumlah kasus selama periode waktu tertentu.
Bagan ini memiliki beberapa kesalahan yang membuatnya mudah salah paham. Sumbu x, misalnya, tidak memiliki label yang menjelaskan bahwa itu mewakili perkembangan kasus dari waktu ke waktu.
Lebih buruk lagi, tanggal pada grafik tidak diatur secara kronologis. Tanggal untuk bulan April dan Mei tersebar di seluruh grafik untuk menunjukkan bahwa jumlah kasus terus menurun. Setiap negara juga terdaftar sedemikian rupa sehingga terlihat bahwa kasusnya menurun.
Kemudian, mereka memublikasikan ulang bagan tersebut dengan tanggal dan wilayah yang tertata lebih baik:
Angka yang Tidak Akurat
Contoh lain dari statistik yang menyesatkan datang dalam bentuk angka yang tidak akurat. Perhatikan pernyataan ini dari kampanye lama Reebok.
Iklan tersebut membuat klaim bahwa sepatu tersebut bekerja pada paha belakang dan betis seseorang 11% lebih keras dan dapat mengencangkan bokong seseorang hingga 28% lebih banyak daripada sepatu kets lainnya . Yang harus dilakukan orang hanyalah berjalan dengan sepatu kets.
Angka-angka tersebut menunjukkan bahwa Reebok telah melakukan penelitian ekstensif tentang manfaat sepatu tersebut.
Kenyataannya adalah, angka-angka itu sepenuhnya dibuat-buat. Merek menerima penalti karena menggunakan statistik yang menyesatkan tersebut. Mereka juga harus mengubah pernyataan dan menghapus nomor palsu.
Bagaimana Menghindari dan Mengidentifikasi Penyalahgunaan Statistik
Statistik memiliki potensi untuk menjadi sangat berguna. Tetapi statistik yang menyesatkan juga berpotensi membingungkan dan mengelabui orang. Statistik memberi otoritas pada pernyataan dan meyakinkan orang untuk percaya pada argumen tertentu.
Statistik yang solid dan benar membantu memberikan wawasan kepada orang-orang dan membantu mereka membuat keputusan. Tetapi statistik yang menyesatkan itu berbahaya . Alih-alih membantu orang menghindari jebakan dan lubang, mereka mengarahkan orang langsung ke situasi yang ingin mereka hindari.
Tetapi adalah mungkin untuk mengidentifikasi statistik dan data yang menyesatkan. Saat Anda menemukan statistik, berhentilah dan ajukan pertanyaan berikut:
- Dari mana data ini berasal?
- Apakah sumber dikendalikan? Atau apakah itu percobaan ukuran sampel?
- Apa faktor lain yang bisa berperan dalam hasil ini?
- Apakah informasi tersebut mencoba memberi tahu saya, atau mengarahkan saya ke kesimpulan yang telah ditentukan sebelumnya?
Apakah Anda mengumpulkan data atau melihat hasil penelitian orang lain, pastikan datanya akurat. Dengan begitu Anda tidak menambah penyebaran statistik yang menyesatkan .
Jika Anda senang membaca artikel tentang Statistik yang Menyesatkan ini, Anda juga harus membaca ini:
- Visualisasi Data Interaktif Paling Mengesankan yang Akan Anda Temukan Online
- Alat Visualisasi Data WordPress Terbaik yang Dapat Anda Temukan
- Alat dan Platform Visualisasi Data Terbaik untuk Anda