Estatísticas enganosas podem ser perigosas (alguns exemplos)
Publicados: 2022-12-06As pessoas confiam nas estatísticas para obter informações importantes. No mundo dos negócios, as estatísticas podem ser úteis para rastrear tendências e maximizar a produtividade. Mas às vezes as estatísticas podem ser apresentadas de forma enganosa . Por exemplo, em 2007, a Advertising Standards Authority (ADA) no Reino Unido recebeu uma reclamação sobre um anúncio da Colgate.
O anúncio afirma que 80% dos dentistas recomendam o uso do creme dental Colgate. A reclamação que a ADA recebeu argumentava que isso era uma violação das regras de publicidade no Reino Unido. Depois de investigar o assunto, a ADA descobriu que o anúncio estava usando estatísticas enganosas.
É verdade que muitos dentistas recomendam o creme dental Colgate. Mas nem todos citaram a Colgate como recomendação número um. A maioria dos dentistas também recomendava outros tipos de creme dental, e a Colgate geralmente surgia em algum momento posterior.
Este é apenas um exemplo de como as estatísticas enganosas são usadas. As pessoas se deparam com exemplos de estatísticas enganosas em muitas áreas diferentes da vida. Você pode encontrar exemplos nas notícias, na publicidade, na política e até na ciência.
Esta postagem ajudará você a aprender a reconhecer estatísticas enganosas e outros dados enganosos . Ele discutirá como esses dados enganam as pessoas. Você também aprenderá quando e como usar dados ao tomar decisões críticas.
O que são estatísticas enganosas?
As estatísticas são o resultado da coleta de dados numéricos, analisando-os cuidadosamente e depois interpretando-os . É especialmente útil ter estatísticas se você estiver lidando com uma grande quantidade de dados, mas qualquer coisa que possa ser medida pode se tornar uma estatística. As estatísticas geralmente revelam muito sobre o mundo e como ele funciona.
No entanto, quando essa informação é mal utilizada, mesmo por acidente, torna-se uma estatística enganosa. Estatísticas enganosas fornecem às pessoas informações falsas que as enganam em vez de informá-las .
Quando as pessoas pegam uma estatística fora de contexto, ela perde seu valor e pode fazer com que as pessoas tirem conclusões incorretas. O termo “estatísticas enganosas” descreve qualquer método estatístico que represente dados incorretamente. Quer tenha sido intencional ou não , ainda contaria como estatísticas enganosas.
Ao coletar dados para uma estatística, há três pontos principais a serem lembrados. Um problema com a análise de dados pode ocorrer durante qualquer um desses pontos.
- Coleta: Ao coletar os dados
- Processamento: Ao analisar os dados e suas implicações
- Apresentação: Ao compartilhar suas descobertas com outras pessoas
Um Tamanho de Amostra Pequeno
Pesquisas de tamanho de amostra são um exemplo de criação de estatísticas enganosas. Pesquisas ou estudos realizados em uma audiência de tamanho de amostra geralmente produzem resultados que são tão enganosos que são inutilizáveis.
Para ilustrar, uma pesquisa faz a 20 pessoas uma pergunta de sim ou não. 19 das pessoas responderam sim à pesquisa. Portanto, os resultados mostram que 95% das pessoas responderiam sim a essa pergunta. Mas esta não é uma boa pesquisa porque a informação é limitada.
Essa estatística não tem valor real. Agora, se você fizer a mesma pergunta a 1.000 pessoas e 950 disserem sim, então essa é uma estatística muito mais confiável para mostrar que 95% das pessoas diriam sim.
Para conduzir um estudo de tamanho de amostra confiável, você precisa considerar três coisas:
- Um : Que tipo de pergunta você está fazendo?
- Dois : Qual é o significado da estatística que você está tentando encontrar?
- E três : Que técnica estatística você usará?
Para obter resultados confiáveis, qualquer análise quantitativa de tamanho de amostra deve incluir pelo menos 200 pessoas.
Perguntas carregadas
É importante procurar dados de uma fonte neutra . Caso contrário, as informações são distorcidas. Perguntas carregadas usam uma suposição controversa ou injustificada para manipular a resposta. Um exemplo disso é fazer uma pergunta que começa com “O que você ama?”. Essa pergunta faz um ótimo trabalho ao coletar feedback positivo, mas não ensina nada de útil. Não oferece oportunidade para a pessoa dar seus pensamentos e opiniões honestas.
Considere a diferença nas duas perguntas a seguir:
- Você apoia uma reforma tributária que implicaria em impostos mais altos?
- Você apoia uma reforma tributária que seja benéfica para a redistribuição social?
A pergunta refere-se essencialmente ao mesmo assunto, mas os resultados de cada uma dessas perguntas seriam bem diferentes. As pesquisas devem ser conduzidas de maneira imparcial e imparcial. Você deseja obter as opiniões honestas das pessoas e o quadro completo do que as pessoas pensam. Para conseguir isso, suas perguntas não devem implicar na resposta nem provocar uma resposta emocional .
Citando “médias” enganosas
Algumas pessoas usam o termo “médio” para obscurecer a verdade ou mentir para fazer a informação parecer melhor.
Essa técnica é especialmente útil se alguém quiser fazer um número parecer maior ou melhor do que é. Por exemplo, uma universidade que deseja atrair novos alunos pode fornecer um salário anual “médio” para os graduados de sua escola. Mas pode haver apenas um punhado de estudantes que realmente têm altos salários. Mas seus salários tornam a renda média de todos os alunos mais alta. Isso parece melhor para toda a média.
As médias também são úteis para esconder a desigualdade. Como outro exemplo, suponha que uma empresa pague $ 20.000 por ano a seus 90 funcionários. Mas seu chefe recebe $ 200.000 por ano. Se você combinar o salário do patrão com o salário dos funcionários, a renda média de cada membro da empresa é de $ 21.978.
No papel, isso parece ótimo. Mas esse número não conta toda a história porque um dos funcionários (o chefe) está ganhando muito mais do que os outros trabalhadores. Portanto, esses tipos de resultados contam como estatísticas enganosas.
Dados cumulativos vs. anuais
Dados cumulativos rastreiam informações em um gráfico ao longo do tempo. Cada vez que você insere dados nos gráficos, o gráfico sobe.
Os dados anuais apresentam todos os dados de um ano específico.
As informações de rastreamento para cada ano fornecem uma imagem mais verdadeira das tendências gerais.
Um exemplo de gráfico cumulativo é o gráfico Worldometer COVID-19. Durante a pandemia do COVID-19, muitos exemplos de gráficos cumulativos surgiram. Eles geralmente refletem o número cumulativo de casos de COVID em uma área específica.
Algumas empresas usam gráficos como este para fazer as vendas parecerem maiores do que são. Em 2013, o CEO da Apple, Tim Cook, recebeu críticas por usar uma apresentação que mostrava apenas o número acumulado de vendas do iPhone. Muitos na época sentiram que ele havia feito isso intencionalmente para esconder o fato de que as vendas do iPhone estavam diminuindo.
Isso não quer dizer que todos os dados cumulativos sejam ruins ou falsos. Na verdade, pode ser útil para rastrear alterações ou crescimento e vários totais. Mas o importante é ficar atento às mudanças nos dados. Em seguida, examine mais profundamente o que os causou, em vez de confiar no gráfico para lhe contar tudo.
Supergeneralização e amostras tendenciosas
A supergeneralização ocorre quando alguém supõe que o que é verdade para uma pessoa deve ser verdade para todas as outras. Normalmente, essa falácia ocorre quando alguém realiza um estudo com um determinado grupo de pessoas. Eles então assumem que os resultados serão verdadeiros para outro grupo de pessoas não relacionado.
Amostras não representativas, ou amostras tendenciosas, são pesquisas que não representam com precisão a população em geral.
Um exemplo de amostras tendenciosas ocorreu durante as eleições presidenciais de 1936 nos Estados Unidos da América.
A Literary Digest, uma revista popular na época, fez uma pesquisa para prever quem venceria as eleições. Os resultados previam que Alfred Landon venceria por uma vitória esmagadora.
Esta revista era conhecida por prever com precisão o resultado das eleições. Este ano, no entanto, eles estavam completamente errados. Franklin Roosevelt venceu com quase o dobro dos votos de seu oponente.
Mais algumas pesquisas revelaram que duas variáveis entraram em jogo que distorceram os resultados.
Primeiro , a maioria dos participantes da pesquisa eram pessoas encontradas na lista telefônica e nas listas de registro automático. Portanto, a pesquisa foi realizada apenas com pessoas de um determinado status socioeconômico.
O segundo fator foi que aqueles que votaram em Landon estavam mais dispostos a responder à pesquisa do que aqueles que escolheram votar em Roosevelt. Portanto, os resultados refletiram esse viés.
Truncando um Eixo
Truncar o eixo em um gráfico é outro exemplo de estatística enganosa. Na maioria dos gráficos estatísticos, os eixos x e y presumivelmente começam do zero. Mas truncar o eixo significa que o gráfico realmente inicia os eixos em algum outro valor. Isso afeta a aparência de um gráfico e afeta as conclusões que uma pessoa tirará.
Aqui está um exemplo que ilustra isso:
Outro exemplo disso aconteceu recentemente em setembro de 2021. Em uma transmissão da Fox News, o âncora usou um gráfico mostrando o número de americanos que afirmavam ser cristãos. O gráfico mostrou que o número de americanos que se identificam como cristãos caiu drasticamente nos últimos 10 anos.
No gráfico a seguir, vemos que em 2009 77% dos americanos se identificavam como cristãos.
Em 2019, o número caiu para 65%. Na realidade, isso não é uma grande queda. Mas o eixo neste gráfico começa em 58% e para em 78%. Portanto, a queda de 12% de 2009 a 2019 parece muito mais drástica do que realmente é.
Causalidade e Correlação
Pode ser fácil supor uma conexão entre dois pontos de dados aparentemente conectados. No entanto, diz-se que a correlação não implica causalidade . Por que?
Este gráfico ilustra por que correlação não é o mesmo que causalidade.
Os pesquisadores geralmente sofrem muita pressão para descobrir dados novos e úteis. Portanto, a tentação de pular a arma e tirar conclusões prematuramente está sempre presente. É por isso que é importante em cada situação procurar a causa e o efeito reais .
Usando porcentagens para ocultar números e cálculos
Uma porcentagem pode ocultar números exatos e fazer com que os resultados pareçam mais respeitáveis e confiáveis do que realmente são.
Por exemplo, se duas em cada três pessoas preferem um determinado produto de limpeza, pode-se dizer que 66,667% das pessoas preferem esse produto. Isso faz com que o número pareça mais oficial, especialmente com os números após a vírgula incluídos.
Aqui estão algumas outras maneiras pelas quais decimais e porcentagens podem obscurecer a verdade:
- Ocultando números brutos e tamanhos de amostra pequenos . As porcentagens obscurecem o valor absoluto dos números brutos. Isso os torna úteis para pessoas que desejam ocultar números nada lisonjeiros ou resultados de tamanho de amostra pequeno.
- Usando diferentes bases. Como as porcentagens não fornecem os números originais nos quais se baseiam, pode ser fácil distorcer os resultados. Se alguém quisesse fazer um número parecer melhor, poderia calcular esse número a partir de uma base diferente.
Isso aconteceu uma vez em um relatório do New York Times divulgado sobre os trabalhadores sindicalizados. Os trabalhadores tiveram um corte salarial de 20% em um ano e, no ano seguinte, o Times informou que os trabalhadores sindicalizados receberam um aumento de 5%. Portanto, a alegação era de que eles receberam um quarto de seu corte de pagamento.
No entanto, os trabalhadores receberam um aumento de 5% com base em seu salário atual, não no salário que tinham antes do corte salarial. Portanto, embora parecesse bom no papel, o corte salarial de 20% e o aumento de 5% foram calculados a partir de números básicos diferentes. Os dois números realmente não se comparam.
Escolher a dedo/descartar dados desfavoráveis
O termo “colheita de cereja” é baseado na ideia de colher apenas os melhores frutos de uma árvore. Qualquer um que veja essa fruta é obrigado a pensar que todas as frutas da árvore são igualmente saudáveis. Obviamente, isso não é necessariamente o caso.
Este mesmo princípio entra em jogo no caso das mudanças climáticas. Muitos gráficos limitam seu quadro de dados para mostrar apenas as mudanças climáticas dos anos de 2000 a 2013.
Como resultado, parece que as alterações e anomalias de temperatura são consistentes e não mudam muito. Quando você dá um passo para trás e olha para o quadro geral, fica claro onde estão as mudanças e anomalias.
Isso também ocorre no campo da medicina veterinária. Quando os veterinários são solicitados a apresentar os resultados de um novo medicamento experimental, eles tendem a apresentar os melhores resultados. Especialmente se uma empresa farmacêutica está apoiando o teste, eles querem ver apenas os melhores resultados.
Seus belos dados merecem estar online
wpDataTables pode fazer isso. Há uma boa razão pela qual é o plug-in nº 1 do WordPress para criar tabelas e gráficos responsivos.
E é muito fácil fazer algo assim:
- Você fornece os dados da tabela
- Configure e personalize
- Publique-o em um post ou página
E não é apenas bonito, mas também prático. Você pode criar tabelas grandes com até milhões de linhas, ou pode usar filtros e pesquisas avançadas, ou pode ir à loucura e torná-las editáveis.
“É, mas eu gosto muito de Excel e não tem nada disso em sites”. Sim, existe. Você pode usar a formatação condicional como no Excel ou no Planilhas Google.
Eu disse que você também pode criar gráficos com seus dados? E isso é apenas uma pequena parte. Existem muitos outros recursos para você.
Pesca de dados
A pesca de dados, também conhecida como dragagem de dados, é a análise de grandes quantidades de dados com o objetivo de encontrar uma correlação. No entanto, como discutido anteriormente neste post, a correlação não implica causalidade. Insistindo que isso só resulta em estatísticas enganosas.
Você pode ver exemplos de pesca de dados em campos da indústria todos os dias. Uma semana é divulgado um escândalo sobre mineração de dados e, uma semana depois, é refutado por um relatório ainda mais ultrajante.
Outro problema com esse tipo de análise de dados é que as pessoas escolhem apenas os dados que suportam sua visão e ignoram o resto. Ao omitir informações contraditórias, eles tornam os resultados mais convincentes .
Gráficos e rótulos de gráficos confusos
Quando a pandemia de COVID-19 começou, mais pessoas do que nunca recorreram a visualizações de dados da propagação do vírus. As pessoas que nunca tiveram que trabalhar com uma representação visual de estatísticas foram repentinamente jogadas fora do fundo dos dados estatísticos.
Além disso, as organizações geralmente tentavam obter informações das pessoas rapidamente. Às vezes, isso significava sacrificar estatísticas precisas. Isso causou um aumento nas estatísticas enganosas e na má interpretação dos dados.
Cerca de cinco meses após o início da disseminação do COVID-19, o Departamento de Saúde Pública da Geórgia dos EUA divulgou este gráfico:
O objetivo do gráfico era mostrar os 5 países com os maiores casos de COVID nos últimos 15 dias e o número de casos em um período de tempo.
Este gráfico tem alguns erros que facilitam o mal-entendido. O eixo x, por exemplo, não possui um rótulo explicando que representa a progressão dos casos ao longo do tempo.
Pior ainda, as datas no gráfico não são organizadas cronologicamente. As datas de abril e maio estão espalhadas pelo gráfico para dar a impressão de que o número de casos está diminuindo constantemente. Cada país também está listado de forma a dar a impressão de que os casos estavam caindo.
Mais tarde, eles republicaram o gráfico com datas e municípios mais bem organizados:
Números imprecisos
Outro exemplo de estatísticas enganosas vem na forma de números imprecisos. Observe esta declaração de uma antiga campanha da Reebok.
O anúncio afirma que o sapato trabalha os isquiotibiais e panturrilhas de uma pessoa 11% mais e pode tonificar a bunda de uma pessoa até 28% a mais do que outros tênis . Tudo o que a pessoa precisa fazer é andar de tênis.
Esses números fazem parecer que a Reebok fez uma extensa pesquisa sobre os benefícios do tênis.
A realidade era que esses números eram completamente inventados. A marca recebeu uma penalidade por usar tais estatísticas enganosas. Eles também tiveram que mudar a declaração e remover os números falsos.
Como Evitar e Identificar o Uso Indevido de Estatísticas
As estatísticas têm o potencial de serem extremamente úteis. Mas estatísticas enganosas também têm o potencial de confundir e enganar as pessoas. As estatísticas dão autoridade a uma declaração e convencem as pessoas a confiar em um determinado argumento.
Estatísticas sólidas e verdadeiras ajudam a dar às pessoas uma visão e a tomar decisões. Mas estatísticas enganosas são perigosas . Em vez de ajudar as pessoas a evitar armadilhas e buracos, eles conduzem as pessoas diretamente para as situações que desejam evitar.
Mas é possível identificar estatísticas e dados enganosos. Quando você se deparar com uma estatística, pare e faça as seguintes perguntas:
- De onde vêm esses dados?
- A fonte é controlada? Ou é um experimento de tamanho de amostra?
- Que outros fatores podem influenciar esse resultado?
- A informação está tentando me informar ou está me direcionando para uma conclusão predeterminada?
Esteja você coletando dados ou visualizando os resultados da pesquisa de outras pessoas, certifique-se de que os dados sejam precisos. Dessa forma, você não está aumentando a propagação de estatísticas enganosas .
Se você gostou de ler este artigo sobre estatísticas enganosas, leia também:
- A visualização de dados interativa mais impressionante que você encontrará online
- As melhores ferramentas de visualização de dados do WordPress que você pode encontrar
- As melhores ferramentas e plataformas de visualização de dados para você