Yanıltıcı İstatistikler Tehlikeli Olabilir (Bazı Örnekler)
Yayınlanan: 2022-12-06İnsanlar önemli bilgiler elde etmek için istatistiklere güvenirler. İş dünyasında istatistikler, trendleri izlemek ve üretkenliği en üst düzeye çıkarmak için yararlı olabilir. Ancak bazen istatistikler yanıltıcı bir şekilde sunulabilir . Örneğin, 2007'de İngiltere'deki Reklam Standartları Kurumu (ADA) bir Colgate reklamıyla ilgili bir şikayet aldı.
Reklam, diş hekimlerinin %80'inin Colgate diş macunu kullanılmasını önerdiğini iddia ediyor. ADA'nın aldığı şikayet, bunun Birleşik Krallık'taki reklamcılık kurallarının ihlali olduğunu savundu. ADA konuyu inceledikten sonra, reklamın yanıltıcı istatistikler kullandığını keşfetti.
Birçok diş hekiminin Colgate diş macununu tavsiye ettiği doğrudur. Ancak hepsi Colgate'i bir numaralı tavsiyeleri olarak göstermedi. Diş hekimlerinin çoğu başka türde diş macunlarını da tavsiye etti ve Colgate genellikle daha sonra bir noktada ortaya çıktı.
Bu, yanıltıcı istatistiklerin nasıl kullanıldığına dair yalnızca bir örnektir. İnsanlar hayatın pek çok farklı alanında yanıltıcı istatistik örnekleriyle karşılaşmaktadır. Haberlerde, reklamlarda, siyasette ve hatta bilimde örnekler bulabilirsiniz.
Bu gönderi, yanıltıcı istatistikleri ve diğer yanıltıcı verileri tanımayı öğrenmenize yardımcı olacaktır. Bu verilerin insanları nasıl yanılttığı tartışılacak. Kritik kararlar alırken verileri ne zaman ve nasıl kullanacağınızı da öğreneceksiniz.
Yanıltıcı İstatistikler Nelerdir?
İstatistik, sayısal verilerin toplanması, dikkatlice analiz edilmesi ve ardından yorumlanmasının sonucudur . Büyük miktarda veriyle uğraşıyorsanız istatistiklere sahip olmak özellikle yararlıdır, ancak ölçülebilen her şey bir istatistik haline gelebilir. İstatistikler genellikle dünya ve işleyişi hakkında çok şey ortaya koyar.
Ancak, bu bilgi yanlışlıkla bile olsa kötüye kullanıldığında yanıltıcı bir istatistik haline gelir. Yanıltıcı istatistikler, insanlara bilgi vermek yerine onları aldatan yanlış bilgiler verir .
İnsanlar bir istatistiği bağlamından kopardığında, değerini kaybeder ve insanların yanlış sonuçlara varmasına neden olabilir. "Yanıltıcı istatistikler" terimi, verileri yanlış temsil eden herhangi bir istatistiksel yöntemi tanımlar. Kasıtlı olsun ya da olmasın , yine de yanıltıcı istatistikler olarak kabul edilecektir.
Bir istatistik için veri toplarken akılda tutulması gereken üç temel nokta vardır. Bu noktalardan herhangi biri sırasında veri analiziyle ilgili bir sorun ortaya çıkabilir.
- Toplama: Verileri toplarken
- İşleme: Verileri ve etkilerini analiz ederken
- Sunum: Bulgularınızı başkalarıyla paylaşırken
Küçük Bir Örnek Boyutu
Örneklem boyutu araştırmaları, yanıltıcı istatistikler oluşturmaya bir örnektir. Örneklem büyüklüğündeki bir kitle üzerinde yürütülen anketler veya araştırmalar, çoğu kez, kullanılamayacak kadar yanıltıcı sonuçlar verir.
Örnek vermek gerekirse, bir anket 20 kişiye evet veya hayır sorusu sorar. Ankete 19 kişi evet yanıtı vermiştir. Dolayısıyla sonuçlar, insanların %95'inin bu soruya evet yanıtı vereceğini gösteriyor. Ancak bilgiler sınırlı olduğu için bu iyi bir anket değil.
Bu istatistiğin gerçek bir değeri yoktur. Şimdi aynı soruyu 1000 kişiye sorarsanız ve 950 kişi evet derse, o zaman bu, insanların %95'inin evet diyeceğini gösteren çok daha güvenilir bir istatistiktir.
Güvenilir bir örneklem büyüklüğü çalışması yürütmek için üç şeyi göz önünde bulundurmanız gerekir:
- Bir : Ne tür bir soru soruyorsun?
- İki : Bulmaya çalıştığınız istatistiğin önemi nedir?
- Ve üç : Hangi istatistiksel tekniği kullanacaksınız?
Güvenilir sonuçlara sahip olmak için, herhangi bir örneklem büyüklüğündeki kantitatif analiz en az 200 kişiyi içermelidir.
Yüklenen Sorular
Tarafsız bir kaynaktan veri aramak önemlidir. Aksi takdirde, bilgi eğimlidir. Yüklü sorular, yanıtı manipüle etmek için tartışmalı veya gerekçesiz bir varsayım kullanır. Bunun bir örneği, "Neyi seviyorsun?" diye başlayan bir soru sormaktır. Bu soru, olumlu geri bildirim toplamak için harika bir iş çıkarıyor, ancak size yararlı bir şey öğretemiyor. Kişinin dürüst düşünce ve kanaatlerini ortaya koymasına fırsat vermez.
Aşağıdaki iki sorudaki farkı düşünün:
- Daha yüksek vergiler anlamına gelecek bir vergi reformunu destekliyor musunuz?
- Sosyal yeniden dağıtım için faydalı olacak bir vergi reformunu destekliyor musunuz?
Soru esasen aynı konuyla ilgilidir, ancak bu soruların her birinin sonuçları oldukça farklı olacaktır. Anketler tarafsız, tarafsız bir şekilde yapılmalıdır. İnsanların dürüst fikirlerini ve ne düşündüklerinin tam resmini almak istiyorsunuz. Bunu başarmak için, sorularınız yanıtı ima etmemeli veya duygusal bir tepki uyandırmamalıdır .
Yanıltıcı “Ortalamalardan” Alıntı Yapmak
Bazı insanlar gerçeği gizlemek için "ortalama" terimini kullanır veya bilgiyi daha iyi göstermek için yalan söyler.
Bu teknik, birisi bir sayıyı olduğundan daha büyük veya daha iyi göstermek istediğinde özellikle kullanışlıdır. Örneğin, yeni öğrencileri çekmek isteyen bir üniversite, okullarından mezun olanlar için "ortalama" bir yıllık maaş sağlayabilir. Ancak, gerçekte yüksek maaşları olan yalnızca bir avuç öğrenci olabilir. Ancak maaşları, tüm öğrenciler için ortalama geliri yükseltiyor. Bu, tüm ortalama için daha iyi görünüyor.
Ortalamalar, eşitsizliği gizlemek için de kullanışlıdır. Başka bir örnek olarak, bir şirketin 90 çalışanına yılda 20.000 dolar ödediğini varsayalım. Ancak patronları yılda 200.000 dolar alıyor. Patronun maaşı ile çalışanların maaşını birleştirirseniz, şirketin her bir üyesinin ortalama geliri 21.978 dolar.
Kağıt üzerinde, bu harika görünüyor. Ancak bu sayı tüm hikayeyi anlatmakta yetersiz kalıyor çünkü çalışanlardan biri (patron) diğer çalışanlardan çok daha fazla kazanıyor. Dolayısıyla bu tür sonuçlar yanıltıcı istatistikler olarak kabul edilir.
Kümülatif ve Yıllık Veriler
Kümülatif veriler, zaman içinde bir grafikteki bilgileri izler. Grafiklere her veri girdiğinizde, grafik yükselir.
Yıllık veriler, belirli bir yıla ait tüm verileri sunar.
Her yıl için izleme bilgileri, genel eğilimlerin daha gerçekçi bir resmini sunar.
Kümülatif grafiğe bir örnek, Worldometer COVID-19 grafiğidir. COVID-19 salgını sırasında, birçok kümülatif grafik örneği ortaya çıktı. Genellikle belirli bir alandaki kümülatif COVID vaka sayısını yansıtırlar.
Bazı şirketler, satışların olduğundan daha büyük görünmesini sağlamak için bunun gibi grafikleri kullanır. 2013 yılında, Apple'ın CEO'su Tim Cook, yalnızca kümülatif iPhone satışlarını gösteren bir sunum kullandığı için eleştirildi. O zamanlar birçok kişi, iPhone satışlarının azaldığı gerçeğini gizlemek için bunu kasıtlı olarak yaptığını hissetti.
Bu, tüm kümülatif verilerin kötü veya yanlış olduğu anlamına gelmez. Aslında, değişiklikleri veya büyümeyi ve çeşitli toplamları izlemek için yararlı olabilir. Ama önemli olan verilerdeki değişimlere dikkat etmek. Ardından, size her şeyi anlatması için tabloya güvenmek yerine, bunlara neyin sebep olduğuna daha derinlemesine bakın.
Aşırı Genelleme ve Taraflı Örnekler
Aşırı genelleme, birisi bir kişi için doğru olanın diğer herkes için de doğru olması gerektiğini varsaydığında ortaya çıkar. Genellikle, bu yanılgı, birisi belirli bir grup insanla bir çalışma yürüttüğünde ortaya çıkar. Daha sonra, sonuçların ilgisiz başka bir insan grubu için geçerli olacağını varsayarlar.
Temsili olmayan örnekler veya önyargılı örnekler, genel popülasyonu doğru bir şekilde temsil etmeyen anketlerdir.
Önyargılı örneklerin bir örneği, Amerika Birleşik Devletleri'ndeki 1936 başkanlık seçimleri sırasında meydana geldi.
Dönemin popüler bir dergisi olan Literary Digest, seçimleri kimin kazanacağını tahmin etmek için bir anket yaptı. Sonuçlar, Alfred Landon'un heyelanla kazanacağını tahmin etti.
Bu dergi, seçimlerin sonucunu doğru bir şekilde tahmin etmesiyle biliniyordu. Ancak bu yıl tamamen yanıldılar. Franklin Roosevelt, rakibinin neredeyse iki katı oy alarak kazandı.
Biraz daha araştırma, sonuçları çarpıtan iki değişkenin devreye girdiğini ortaya çıkardı.
İlk olarak, ankete katılanların çoğu telefon rehberinde ve otomatik kayıt listelerinde bulunan kişilerdi. Bu nedenle anket sadece belli bir sosyo-ekonomik statüden olanlarla yapılmıştır.
İkinci faktör , Landon'a oy verenlerin Roosevelt'e oy verenlere göre ankete yanıt vermeye daha istekli olmalarıydı. Dolayısıyla sonuçlar bu önyargıyı yansıtıyordu.
Bir Ekseni Kesmek
Bir grafikte ekseni kesmek, yanıltıcı istatistiklere başka bir örnektir. Çoğu istatistiksel grafikte, hem x hem de y ekseni muhtemelen sıfırdan başlar. Ancak ekseni kesmek, grafiğin aslında eksenleri başka bir değerde başlattığı anlamına gelir. Bu, grafiğin nasıl görüneceğini ve kişinin çıkaracağı sonuçları etkiler.
İşte bunu gösteren bir örnek:
Bunun bir başka örneği de geçtiğimiz günlerde Eylül 2021'de yaşandı. Bir Fox News yayınında sunucu, Hıristiyan olduğunu iddia eden Amerikalıların sayısını gösteren bir tablo kullandı. Grafik, Hıristiyan olarak tanımlanan Amerikalıların sayısının son 10 yılda büyük ölçüde düştüğünü gösterdi.
Aşağıdaki grafikte 2009 yılında Amerikalıların %77'sinin kendilerini Hristiyan olarak tanımladığını görüyoruz.
2019 itibariyle, sayı% 65'e düştü. Aslında bu çok büyük bir düşüş değil. Ancak bu grafikteki eksen %58'de başlar ve %78'de durur. Dolayısıyla 2009'dan 2019'a %12'lik düşüş, gerçekte olduğundan çok daha sert görünüyor.
Nedensellik ve Korelasyon
Birbirine bağlı gibi görünen iki veri noktası arasında bir bağlantı olduğunu varsaymak kolay olabilir. Ancak, korelasyonun nedensellik anlamına gelmediği söylenir. Neden böyle?
Bu grafik korelasyonun neden nedensellikle aynı olmadığını göstermektedir.
Araştırmacılar genellikle yeni, faydalı verileri keşfetme konusunda büyük bir baskı altındadır. Bu nedenle, silahı atlayıp vaktinden önce sonuçlar çıkarma cazibesi her zaman oradadır. Bu nedenle , her durumda asıl neden ve sonucu aramak önemlidir .
Sayıları ve Hesaplamaları Gizlemek İçin Yüzdeleri Kullanma
Yüzde, kesin sayıları gizleyebilir ve sonuçların olduğundan daha saygın ve güvenilir görünmesini sağlayabilir.
Örneğin, her üç kişiden ikisi belirli bir temizlik ürününü tercih ediyorsa, insanların %66,667'sinin o ürünü tercih ettiğini söyleyebilirsiniz. Bu, özellikle ondalık noktadan sonraki sayılar dahil edildiğinde, sayının daha resmi görünmesini sağlar.
İşte ondalık sayıların ve yüzdelerin gerçeği gizleyebileceği diğer birkaç yol:
- Ham sayıları ve küçük örneklem boyutlarını gizleme . Yüzdeler, ham sayıların mutlak değerini gizler. Bu, onları kötüleyen sayıları veya küçük örneklem boyutlu sonuçları gizlemek isteyen kişiler için yararlı kılar.
- Farklı bazlar kullanmak. Yüzdeler, dayandıkları orijinal sayıları sağlamadığından, sonuçları bozmak kolay olabilir. Birisi bir sayının daha iyi görünmesini isterse, o sayıyı farklı bir tabandan hesaplayabilir.
Bu, New York Times'ın sendika işçileri hakkında yayınladığı bir raporda bir kez oldu. İşçilere bir yıl %20 maaş kesintisi yapıldı ve sonraki yıl Times, sendika işçilerinin %5 zam aldığını bildirdi. Yani iddia, maaş kesintilerinin dörtte birinin kendilerine iade edildiğiydi.
Ancak işçiler maaş kesintisinden önceki maaşlarına göre değil, mevcut maaşlarına göre %5 zam aldılar. Yani kağıt üzerinde iyi görünse de %20 maaş kesintisi ve %5 zam farklı taban rakamlar üzerinden hesaplandı. İki sayı gerçekten hiç karşılaştırılmadı.
Kiraz Toplama/Olumsuz Verileri Atma
"Kiraz toplama" terimi, bir ağaçtan yalnızca en iyi meyveyi toplama fikrine dayanmaktadır. O meyveyi gören, ağaçtaki bütün meyvelerin aynı derecede sağlıklı olduğunu zanneder. Açıkçası, durum mutlaka böyle değildir.
Aynı ilke iklim değişikliği durumunda devreye giriyor. Birçok tablo, veri çerçevesini yalnızca 2000'den 2013'e kadar olan iklim değişikliklerini gösterecek şekilde sınırlar.
Sonuç olarak, sıcaklık değişimleri ve anormalliklerin tutarlı olduğu ve fazla değişmediği görülmektedir. Yine de bir adım geri çekilip büyük resme baktığınızda, değişikliklerin ve anormalliklerin nerede olduğu netleşiyor.
Bu durum veterinerlik alanında da karşımıza çıkmaktadır. Veterinerlerden yeni bir deneme ilacının sonuçlarını sunmaları istendiğinde, en iyi sonuçları sunma eğilimindedirler. Özellikle bir ilaç şirketi denemeyi destekliyorsa, yalnızca en iyi sonuçları görmek isterler.
Güzel verileriniz çevrimiçi olmayı hak ediyor
wpDataTables bunu bu şekilde yapabilir. Duyarlı tablolar ve grafikler oluşturmak için 1 numaralı WordPress eklentisi olmasının iyi bir nedeni var.
Ve böyle bir şey yapmak gerçekten çok kolay:
- Tablo verilerini sağlıyorsunuz
- Yapılandırın ve özelleştirin
- Bir gönderide veya sayfada yayınlayın
Ve sadece güzel değil, aynı zamanda pratik. Milyonlarca satıra kadar büyük tablolar oluşturabilir veya gelişmiş filtreler ve arama kullanabilir veya çılgına dönüp düzenlenebilir hale getirebilirsiniz.
"Evet, ama Excel'i çok seviyorum ve web sitelerinde böyle bir şey yok". Evet var. Excel veya Google E-Tablolar'daki gibi koşullu biçimlendirmeyi kullanabilirsiniz.
Verilerinizle grafikler de oluşturabileceğinizi söylemiş miydim? Ve bu sadece küçük bir kısmı. Sizin için birçok başka özellik var.
Veri Balıkçılığı
Veri tarama olarak da bilinen veri avcılığı, bir korelasyon bulmak amacıyla büyük miktarda verinin analizidir. Bununla birlikte, bu gönderide daha önce tartışıldığı gibi, korelasyon nedensellik anlamına gelmez. Sadece yanıltıcı istatistiklere yol açtığı konusunda ısrar ediyor.
Her gün endüstri alanlarında veri avcılığının örneklerini görebilirsiniz. Bir hafta veri madenciliği ile ilgili bir skandal çıkar ve bir hafta sonra daha da çirkin bir raporla bu skandal çürütülür.
Bu tür veri analiziyle ilgili bir başka sorun da, insanların yalnızca kendi görüşlerini destekleyen verileri seçmeleri ve gerisini görmezden gelmeleridir. Çelişkili bilgileri atlayarak sonuçların daha inandırıcı görünmesini sağlarlar .
Kafa Karıştıran Grafik ve Grafik Etiketleri
COVID-19 salgını başladığında, her zamankinden daha fazla insan virüsün yayılmasına ilişkin veri görselleştirmelerine yöneldi. İstatistiğin görsel bir sunumuyla çalışmak zorunda kalmayan insanlar aniden istatistiksel verilerin derinliklerinden atıldı.
Ayrıca, kuruluşlar genellikle insanlardan hızlı bir şekilde bilgi almaya çalışıyorlardı. Bazen bu, doğru istatistikleri feda etmek anlamına geliyordu. Bu, yanıltıcı istatistiklerde ve verilerin yanlış yorumlanmasında bir artışa neden oldu.
COVID-19 yayılmaya başladıktan yaklaşık beş ay sonra, ABD Georgia Halk Sağlığı Departmanı şu tabloyu yayınladı:
Grafiğin amacı, önceki 15 gün içinde en yüksek COVID vakasına sahip 5 ülkeyi ve belirli bir süre içindeki vaka sayısını göstermekti.
Bu çizelgede yanlış anlaşılmayı kolaylaştıran birkaç hata var. Örneğin x ekseni, vakaların zaman içindeki ilerlemesini temsil ettiğini açıklayan bir etikete sahip değildir.
Daha da kötüsü, tablodaki tarihler kronolojik olarak düzenlenmemiştir. Nisan ve Mayıs tarihleri, vaka sayısının sürekli olarak düştüğünü göstermek için grafik boyunca dağılmıştır. Her ülke, vakaların düştüğünü gösterecek şekilde de listeleniyor.
Daha sonra, tabloyu daha iyi organize edilmiş tarihler ve ilçelerle yeniden yayınladılar:
Hatalı Sayılar
Yanıltıcı istatistiklerin bir başka örneği de hatalı rakamlardır. Eski bir Reebok kampanyasından bu ifadeye dikkat edin.
Reklam, ayakkabının bir kişinin hamstringlerini ve baldırlarını %11 daha fazla çalıştırdığını ve bir kişinin poposunu diğer spor ayakkabılara göre %28'e kadar daha fazla şekillendirebileceğini iddia ediyor. Kişinin tek yapması gereken spor ayakkabı ile yürümektir.
Bu rakamlar, Reebok'un ayakkabının faydaları konusunda kapsamlı bir araştırma yaptığını gösteriyor.
Gerçek şu ki, bu rakamlar tamamen uyduruldu. Marka, bu tür yanıltıcı istatistikleri kullandığı için ceza aldı. Ayrıca ifadeyi değiştirmek ve sahte numaraları kaldırmak zorunda kaldılar.
İstatistiklerin Kötüye Kullanımı Nasıl Önlenir ve Tespit Edilir
İstatistikler son derece yararlı olma potansiyeline sahiptir. Ancak yanıltıcı istatistikler, insanların kafasını karıştırma ve kandırma potansiyeline de sahiptir. İstatistikler bir ifadeye yetki verir ve insanları belirli bir argümana güvenmeye ikna eder.
Sağlam, gerçek istatistikler, insanlara içgörü kazandırmaya ve karar vermelerine yardımcı olur. Ancak yanıltıcı istatistikler tehlikelidir . İnsanların tuzaklardan ve çukurlardan kaçınmasına yardım etmek yerine, insanları doğrudan kaçınmak istedikleri durumlara yönlendirirler.
Ancak yanıltıcı istatistik ve veriler tespit etmek mümkündür. Bir istatistikle karşılaştığınızda durun ve şu soruları sorun:
- Bu veriler nereden geliyor?
- Kaynak kontrol ediliyor mu? Yoksa örneklem büyüklüğünde bir deney mi?
- Bu sonuçta başka hangi faktörler rol oynayabilir?
- Bilgi beni bilgilendirmeye mi çalışıyor yoksa önceden belirlenmiş bir sonuca mı yönlendiriyor?
İster veri topluyor ister başkalarının araştırmalarının sonuçlarını görüntülüyor olun, verilerin doğru olduğundan emin olun. Bu şekilde, yanıltıcı istatistiklerin yayılmasına katkıda bulunmazsınız .
Yanıltıcı İstatistikler hakkındaki bu makaleyi okumaktan keyif aldıysanız, bunları da okumalısınız:
- İnternette Bulabileceğiniz En Etkileyici İnteraktif Veri Görselleştirme
- Bulabileceğiniz En İyi WordPress Veri Görselleştirme Araçları
- Sizin İçin En İyi Veri Görselleştirme Araçları ve Platformları