Exemplos enganosos de visualização de dados para ficar longe

Publicados: 2022-07-27

A visualização de dados é uma ferramenta essencial para analisar e comunicar materiais de dados complexos . Você deve ter cuidado embora. Quando feito de maneira errada, distorce ou deturpa a informação.

Infelizmente, alguns usam a visualização de dados para deturpar os dados de propósito . Eles têm uma agenda ou querem promover sua própria opinião. Outras visualizações de dados enganosas são o resultado de erros ou falta de compreensão de como apresentar os dados. O design pode ser bonito e atraente, mas inadequado para uma comunicação clara da informação.

Às vezes, a visualização de dados enganosa é óbvia; às vezes é mais sutil. É útil saber como é uma boa visualização de dados e quais são as melhores maneiras de representar dados.

Este artigo mostrará exemplos enganosos de visualização de dados que podem ensinar lições importantes.

Truncamento de escala

Os gráficos de barras são alguns dos exemplos de visualização de dados mais populares. Dá uma ideia rápida do tamanho relativo comparando as alturas das barras. Eles são fáceis de fazer e todos os entendem .

O gráfico de barras neste exemplo compara a receita líquida que a Coca-Cola teve nos últimos anos. A escala vertical vai de 0 a 48 bilhões. Isso é lógico e correto. O eixo Y no próximo exemplo começa em 28 bilhões, o que faz com que o crescimento da receita dos anos seguintes pareça ter atingido a estratosfera.

Gráfico criado com wpDataTables

Cortar parte do eixo vertical enfatiza as diferenças no tamanho das diferentes barras. Alguns usam esse truque para enganar as pessoas, fazendo com que assumam que as diferenças nos dados são maiores do que são .

Gráfico criado com wpDataTables

Aqui está outro exemplo. Ele compara a receita da Apple por região entre 2017 e 2018. À primeira vista, parece que a Apple teve um desempenho muito melhor no Japão do que na Europa.

Isso é verdade ou é um exemplo de visualização de dados ruim? Se você olhar mais de perto, notará o truncamento do eixo Y. Isso resulta em uma deturpação dos dados.

É assim que realmente deve se parecer:

Gráfico criado com wpDataTables

Manipulação do eixo Y

A manipulação adicional do eixo y leva a mais erros de visualização de dados. Você pode mostrar todo o eixo vertical e ainda alterá-lo de tal forma que perca todo o significado. Uma maneira é alterar a escala para enfatizar demais as diferenças de dados .

Essa mudança de eixo é um exemplo muito comum de visualização de dados ruim. As redes sociais estão cheias dessa deturpação. Ele empurra narrativas falsas.

Por exemplo, alguém pode representar pequenas mudanças de temperatura em um gráfico. Para tornar a curva o mais insignificante possível , eles usam uma escala vertical que varia de -10°C a 100°C. Esse é um truque comum para negar os efeitos do aquecimento global.

Pequenas mudanças podem ter grandes efeitos e mudar a história por trás de um conjunto de dados. Veja estes exemplos. Uma pontuação de crédito de 634 em 700

não parece o mesmo que uma pontuação de crédito de 634 em 850.

Ocultar dados relevantes

Mentir sobre dados é uma coisa ruim. Mas é tão ruim quanto deixar de fora os pontos de dados porque eles não atendem ao seu propósito.

Deixar de fora alguns dados concentra a atenção do público em uma parte específica da informação positiva . Isso vai ao custo de precisão e compreensão da história completa. Cada ponto de dados tem uma história para contar e pode transmitir informações importantes. No entanto, cada ponto de dados pode ser enganoso quando não há contexto relevante.

Analise este próximo exemplo na lista de exemplos enganosos de visualização de dados. Em 2018, o Pew Research Center publicou uma pesquisa sobre o uso de mídias sociais.

Um mau exemplo de visualização de dados enfatizaria demais o fato de que 68% dos americanos usam o Facebook.

Este exemplo mostra como alguém pode deixar de fora os pontos de dados para dar uma impressão diferente da progressão do crescimento. Você verá um crescimento mais suave se mostrar os pontos de dados para cada segundo ano

Origem da imagem

em vez de todos os anos. Mas não é assim que a realidade se parece.

As empresas usam essa visualização de dados enganosa omitindo grandes valores discrepantes em vendas ou lucro. Faz parecer que a empresa é mais estável e previsível do que é. Mascara o verdadeiro capricho do mercado. Ao fazer visualizações de dados, certifique-se de dar acesso a todas as informações.

Seus belos dados merecem estar online

wpDataTables pode torná-lo assim. Há uma boa razão pela qual é o plugin nº 1 do WordPress para criar tabelas e gráficos responsivos.

Um exemplo real de wpDataTables em estado selvagem

E é muito fácil fazer algo assim:

  1. Você fornece os dados da tabela
  2. Configure e personalize
  3. Publique-o em um post ou página

E não é apenas bonito, mas também prático. Você pode criar tabelas grandes com até milhões de linhas, ou pode usar filtros e pesquisas avançadas, ou pode enlouquecer e torná-las editáveis.

“É, mas eu gosto demais do Excel e não tem nada disso em sites”. Sim, existe. Você pode usar a formatação condicional como no Excel ou no Planilhas Google.

Eu te disse que você também pode criar gráficos com seus dados? E isso é apenas uma pequena parte. Existem muitos outros recursos para você.

Correlação e Causalidade

Mostrar correlações entre os dados é uma boa maneira de ajudar o público a entender melhor o tema. Você pode fazer isso fazendo sobreposições de conjuntos de dados em um gráfico. A combinação da explicação oral e visual pode ajudar os espectadores a fazer certas conexões importantes. Um aviso também está em vigor. Muitas sobreposições obscurecem as informações em vez de destacar as conexões.

Gráfico criado com wpDataTables

Quando usadas de maneira errada, as sobreposições podem implicar causas que não existem. Aqui está um exemplo bem conhecido. Sugere uma relação entre consumo de sorvete e crimes violentos. Na realidade, ambos são o resultado do clima quente.

Causação não é o mesmo que correlação em dados. Agora que os conjuntos de dados estão se tornando cada vez maiores, a correlação é muito mais enfatizada. É mais fácil detectar uma correlação do que estabelecer uma verdadeira causalidade entre dois fenômenos.

Há uma razão importante pela qual a causação não equivale à correlação. Comparar duas variáveis ​​pode obscurecer a presença de uma terceira variável de confusão.

Uma terceira variável desconhecida pode afetar duas outras variáveis. Pode dar a sugestão da presença de uma relação causal entre os dois. Ninguém pode perceber a presença dessa terceira variável e é impossível estabelecer a causa.

Apanhar cerejas

A colheita de cerejas é um dos muitos exemplos de visualização de dados enganosos conhecidos. Este formulário de visualização de dados omite certas fontes ou informações .

O objetivo é mostrar um conjunto de resultados mais limpo ou previsível e extrair uma tendência ou padrão inexistente. É desonesto e não objetivo. Os resultados tornam-se imprecisos e incompletos e não transmitem conhecimento real.

A colheita seletiva é uma forma de visualização de dados ruim frequentemente vista na indústria farmacêutica. Uma revisão cuidadosa pode mostrá-lo na apresentação de resultados de ensaios clínicos. Um exemplo seriam os antidepressivos. Fica claro ao comparar os dados com os resultados de investigações do mesmo medicamento financiadas pelo governo.

O exemplo acima mostra como a coleta seletiva de dados pode ser perigosa. Um ensaio clínico pode revelar certas complexidades sutis. Estes só podem ser extraídos considerando dados não adulterados.

Escala logarítmica pouco clara

O valor entre dois pontos em um eixo linear é sempre o mesmo. No caso de uma escala logarítmica. o valor entre dois pontos difere de acordo com um determinado padrão. Essa é a maneira mais fácil de ver a diferença entre uma escala linear e uma escala logarítmica.

Isso não significa que uma representação logarítmica seja uma forma de visualização de dados enganosa. Pode ser uma maneira muito eficaz de extrair um relacionamento importante no conjunto de dados. Claro, é importante mostrar que o gráfico usa uma escala logarítmica. Se não for esse o caso, pode levar à perda de significância dos dados.

Os dois gráficos abaixo mostram duas maneiras de apresentar os mesmos dados. Um usa uma escala linear,

Origem da imagem

enquanto o outro usa uma escala logarítmica. Ambas as representações são, em essência, corretas, mas parecem diferentes.

A lição é que você pode usar uma escala logarítmica, mas de alguma forma você precisa deixar isso claro para o espectador .

Visualização não convencional

Os elementos de visualização de dados têm um efeito na psicologia humana . Cores, fontes e ícones têm uma certa conotação mais profunda. Eles influenciam a forma como o espectador percebe a informação. Ignorar ou abusar desses fatos são exemplos enganosos de visualização de dados.

A importância da visualização de dados não deve ser subestimada. Quando o cérebro recebe novas informações, leva tempo para analisar o significado de certos elementos de design.

Ser criativo é bom e pode agregar significado à visualização de dados. Mas não distraia o público com aplicações incomuns de associações visuais usuais como neste exemplo

ou este sobre mortes por arma de fogo.

Origem da imagem

O segundo exemplo é um dos piores exemplos porque é óbvio o que o criador está tentando dizer abaixo da superfície. É uma representação não convencional de cabeça para baixo. Dá a impressão de que as mortes por armas estão em declínio na Flórida quando o oposto é verdadeiro.

Aqui está outro exemplo. Ele mostra um mapa dos Estados Unidos com as taxas de infecção pelo vírus por estado.

Origem da imagem

Ele mostra a taxa com cores diferentes. Em mapas semelhantes, diferentes tons da mesma cor mostram a concentração. Quanto mais escura a cor, maior a taxa de infecção. Este mapa não segue esta convenção. O resultado é muito confuso e pode ser enganoso.

Gráficos de pizza enganosos

Um dos mais comuns, quando se trata de exemplos enganosos de visualização de dados, são os gráficos de pizza. Por definição, um gráfico de pizza completo sempre representa um total de 100% . Isso se torna confuso ou enganoso quando se trata de usar gráficos de pizza para mostrar os resultados de pesquisas com mais de uma resposta.

O exemplo neste gráfico está correto.

Gráfico criado com wpDataTables

As porcentagens no gráfico de pizza somam 100%. Agora imagine uma pesquisa em que uma das perguntas permita aos candidatos mais de uma resposta. Por exemplo, “Para onde você se mudaria para uma situação econômica melhor?” Alguns podem dar duas respostas, por exemplo, Austrália e Europa. Então um gráfico de pizza não funciona mais.

Se alguém usar esse tipo de gráfico, as informações se tornarão distorcidas e imprecisas. Um diagrama de Venn seria uma escolha melhor neste caso.

Dados cumulativos vs. anuais

Uma representação cumulativa adiciona entradas sucessivas. Nesse caso, o gráfico sobe com cada ponto de dados.

Os dados anuais mostrarão os resultados dos dados absolutos para um ano específico. O gráfico pode subir e descer. Em alguns casos, isso pode ser uma representação mais honesta dos resultados.

O gráfico Worldometer COVID-19 serve para ilustrar esse ponto.

E, de fato, os gráficos cumulativos eram muito populares durante o período de pandemia.

Além disso, muitas empresas usam gráficos cumulativos para mostrar seus resultados. Isso faz com que os resultados de vendas pareçam melhores do que são, mas não deixe que eles o enganem.

Em 2013, o CEO da Apple, Tim Cook, recebeu muitas críticas porque usou uma visualização de dados cumulativos para mostrar as vendas do iPad. Muitas pessoas sentiram que a Apple tentou encobrir a queda nas vendas de seus produtos.

Não há nada de errado em mostrar representações de dados cumulativos se você fizer isso da maneira correta. Ele destaca, por exemplo, mudanças no crescimento. Antes de usá-lo, pense no que você quer mostrar e qual impressão quer dar .

Muitas variáveis

Você precisa tomar grandes decisões ao fazer um design para uma representação visual de dados. O que você inclui e o que você exclui? Você quer ser honesto ,   mas a apresentação também deve ser clara . Quanto mais dados você tiver e quanto mais interessantes forem os detalhes, mais difíceis serão as decisões.

Este é um exemplo de como não fazer.

O gráfico contém muita informação e as linhas tornam difícil distinguir qualquer ponto de dados. Você pode até se perguntar se o designer tentou obscurecer alguns dados. Se esse era o objetivo, eles podem ter sido bem sucedidos. De qualquer forma, o resultado é inútil.

Uma inspeção mais detalhada mostrou que o gráfico representava o número e a faixa de alunos do exame durante um longo período. A questão era que as universidades admitiam mais estudantes de grupos minoritários e de renda mais baixa. A inspeção mostrou que dentro desses grupos as pontuações médias aumentaram.

Quando você começar a trabalhar em suas visualizações de dados, pense primeiro no que deseja mostrar e quais dados você precisa para conseguir isso. O número de variáveis ​​de dados determinará que tipo de visualização de dados você usará. Então, pergunte a si mesmo, qual formato de dados será mais eficaz para comunicar meu ponto de vista com clareza?

Uso incorreto de gráficos 3D

Não há dúvida de que seu público vai adorar gráficos 3D. Mas você precisa ser cauteloso ao usar visualizações de dados tridimensionais. Aqui está o porquê.

Dê uma olhada neste exemplo.

Origem da imagem

Como você pode ver à esquerda, um gráfico 3D pode obscurecer os dados bloqueando outras partes do gráfico. Isso ocorre porque um gráfico 3D imita o espaço natural. Isso é um problema quando não permite acesso visual a pontos de dados importantes. Isso pode criar falsas hierarquias e ênfase em certas informações.

A distorção é outro problema associado às visualizações de dados tridimensionais. É o resultado do escorço. Isso é comum em fotos porque os objetos mais próximos de nós parecem maiores do que os mais distantes. Mas na visualização de dados, isso é um problema. Dá a impressão de hierarquias que não existem e distorce os relacionamentos de dados.

Usando o tipo de gráfico errado

Um gráfico de pizza funciona melhor quando há dois ou três itens. Esse é um bom número para o olho humano distinguir. A maioria das pessoas terá dificuldade em entender um gráfico de pizza com quatro ou mais itens. Este gráfico de pizza exemplifica o ponto.

Gráfico criado com wpDataTables

Qual é maior, China ou Outro?

Tipos de dados específicos solicitam um tipo de gráfico específico. Certos tipos de gráficos são úteis para apresentar dados de um tipo diferente. Você pode ter grandes problemas quando tenta usar a abordagem de visualização errada.

Na maioria das vezes, o tipo de dados que você possui determina a maneira como você os visualiza. Antes de tudo, considere se seus dados são qualitativos (descritivos) ou quantitativos (medidas). As informações qualitativas se prestam a gráficos de pizza e de barras. É melhor usar histogramas e gráficos para dados quantitativos.

Dê uma olhada neste exemplo.

Ele mostra os mesmos dados em um gráfico de pizza e em um gráfico de barras. O gráfico de pizza não é a melhor opção de visualização de dados. O gráfico de barras representa os números de forma mais precisa. Os dados em uma torta sempre somam 100%, mas esse não é o caso aqui.

Não usar anotações

Cabe a você usar anotações ou não. Não é obrigatório fazê-lo , mas é uma boa prática . Crie o hábito de fazer isso toda vez que fizer um gráfico.

Pessoas com diferentes origens analisarão suas visualizações de dados. Alguns vão apenas olhar para o visual, outros vão querer um pouco mais de informação. Eles podem precisar de texto e números para esclarecer as dúvidas que têm.

Aqui está um exemplo que ilustra o ponto.

Gráfico criado com wpDataTables

Tudo parece bem e os dados são apresentados corretamente. Mas, quando você analisa os dados em si, pode se perguntar por que há um pico tão grande em 2019. As anotações podem ajudá-lo a esclarecer o problema.

Conclusões após esses exemplos enganosos de visualização de dados

Há muitas maneiras pelas quais as pessoas tentam manipular e deturpar dados. Os 13 exemplos enganosos de visualização de dados acima constituem os mais comuns.

Aprenda lições com os erros que outras pessoas cometeram. Esteja determinado a não fazer os mesmos e seus painéis e apresentações estarão livres de erros. Lembre-se de manter seu público em mente e pensar sobre o que você quer dizer a eles.

Com esse conhecimento, você pode representar os dados da maneira correta e permitir que outras pessoas façam escolhas mais bem informadas.

Se você gostou de ler este artigo sobre exemplos enganosos de visualização de dados, leia estes também:

  • Práticas recomendadas de visualização de dados que você precisa conhecer
  • Exemplos de paleta de cores de visualização de dados excelentes para usar
  • Exemplos impressionantes de visualização de dados para conferir