Ejemplos engañosos de visualización de datos de los que debe mantenerse alejado

Publicado: 2022-07-27

La visualización de datos es una herramienta esencial para analizar y comunicar material de datos complejo . Sin embargo, debes tener cuidado. Cuando se hace de manera incorrecta, distorsionará o tergiversará la información.

Lamentablemente, algunos usan la visualización de datos para tergiversar los datos a propósito . Tienen una agenda o quieren promover su propia opinión. Otras visualizaciones de datos engañosas son el resultado de errores o falta de comprensión de cómo presentar los datos. El diseño puede ser hermoso y atractivo, pero inadecuado para una comunicación clara de la información.

A veces, la visualización de datos engañosa es obvia; a veces es más sutil. Es útil saber cómo es una buena visualización de datos y cuáles son las mejores formas de representar los datos.

Este artículo le mostrará ejemplos engañosos de visualización de datos que pueden enseñarle lecciones importantes.

Truncamiento de escala

Los gráficos de barras son algunos de los ejemplos de visualización de datos más populares. Da una idea rápida del tamaño relativo comparando las alturas de las barras. Son fáciles de hacer y todos los entienden .

El gráfico de barras de este ejemplo compara los ingresos netos que tuvo Coca-Cola en los últimos años. La escala vertical va de 0 a 48 mil millones. Eso es lógico y correcto. El eje Y en el siguiente ejemplo comienza en 28 mil millones, lo que hace que el crecimiento de los ingresos de los años siguientes parezca haberse disparado hasta la estratosfera.

Gráfico creado con wpDataTables

Cortar parte del eje vertical enfatiza las diferencias en el tamaño de las diferentes barras. Algunos usan este truco para engañar a la gente haciéndoles suponer que las diferencias en los datos son mayores de lo que son .

Gráfico creado con wpDataTables

Aquí hay otro ejemplo. Compara los ingresos de Apple por región entre 2017 y 2018. A primera vista, parece que Apple se desempeñó mucho mejor en Japón que en Europa.

¿Es eso cierto o es un ejemplo de mala visualización de datos? Si mira más de cerca, notará el truncamiento del eje Y. Esto resulta en una tergiversación de los datos.

Así es como debería verse realmente:

Gráfico creado con wpDataTables

Manipulación del eje Y

Una mayor manipulación del eje y conduce a más errores de visualización de datos. Puede mostrar todo el eje vertical y aún cambiarlo de tal manera que pierda todo significado. Una forma es cambiando la escala para que enfatice demasiado las diferencias de datos .

Este cambio de eje es un ejemplo muy común de mala visualización de datos. Las redes sociales están llenas de esta tergiversación. Impulsa narrativas falsas.

Por ejemplo, alguien puede representar pequeños cambios de temperatura en un gráfico. Para que la curva sea lo más insignificante posible , utilizan una escala vertical que va de -10 °C a 100 °C. Ese es un truco común para negar los efectos del calentamiento global.

Los pequeños cambios pueden tener grandes efectos y cambiar la historia detrás de un conjunto de datos. Mira estos ejemplos. Un puntaje de crédito de 634 de 700

no se ve igual que un puntaje de crédito de 634 de 850.

Ocultar datos relevantes

Mentir sobre los datos es algo malo. Pero es tan malo como omitir puntos de datos porque no se ajustan a su propósito.

Omitir algunos datos centra la atención de la audiencia en una parte específica de la información positiva . Eso va a costa de la precisión y la comprensión de la historia completa. Cada punto de datos tiene una historia que contar y puede transmitir información importante. Sin embargo, cada punto de datos puede ser engañoso cuando no hay un contexto relevante.

Analice este siguiente ejemplo en la lista de ejemplos de visualización de datos engañosos. En 2018, el Pew Research Center publicó una encuesta sobre el uso de las redes sociales.

Un mal ejemplo de visualización de datos enfatizaría demasiado el hecho de que el 68% de los estadounidenses usan Facebook.

Este ejemplo muestra cómo alguien podría omitir puntos de datos para dar una impresión diferente de la progresión del crecimiento. Verá un crecimiento más suave si muestra los puntos de datos cada dos años

Fuente de imagen

en lugar de cada año. Pero no es así como se ve la realidad.

Las empresas utilizan esta visualización de datos engañosa al omitir grandes valores atípicos en las ventas o las ganancias. Hace que parezca que la empresa es más estable y predecible de lo que es. Enmascara el verdadero capricho del mercado. Cuando realice visualizaciones de datos, asegúrese de dar acceso a toda la información.

Tus hermosos datos merecen estar en línea

wpDataTables puede hacerlo de esa manera. Hay una buena razón por la que es el plugin de WordPress n.º 1 para crear tablas y gráficos receptivos.

Un ejemplo real de wpDataTables en la naturaleza

Y es muy fácil hacer algo como esto:

  1. Usted proporciona los datos de la tabla.
  2. Configúralo y personalízalo
  3. Publicarlo en una publicación o página

Y no solo es bonito, sino también práctico. Puede crear tablas grandes con hasta millones de filas, o puede usar filtros y búsquedas avanzados, o puede volverse loco y hacerlo editable.

“Sí, pero me gusta demasiado Excel y no hay nada de eso en los sitios web”. Sí, lo hay. Puede usar formato condicional como en Excel o Google Sheets.

¿Te dije que también puedes crear gráficos con tus datos? Y eso es solo una pequeña parte. Hay muchas otras características para ti.

Correlación y causalidad

Mostrar correlaciones entre los datos es una buena manera de ayudar a la audiencia a comprender mejor el tema. Puede hacer esto haciendo superposiciones de conjuntos de datos en un gráfico. La combinación de la explicación oral y visual puede ayudar a los espectadores a establecer ciertas conexiones importantes. También hay una advertencia. Demasiadas superposiciones oscurecen la información en lugar de resaltar las conexiones.

Gráfico creado con wpDataTables

Cuando se usan de manera incorrecta, las superposiciones pueden implicar causalidades que no existen. Aquí hay un ejemplo bien conocido. Sugiere una relación entre el consumo de helados y los delitos violentos. En realidad, ambos son el resultado del clima cálido.

La causalidad no es lo mismo que una correlación en los datos. Ahora que los conjuntos de datos son cada vez más grandes, la correlación se enfatiza mucho más. Es más fácil detectar una correlación que establecer una verdadera causalidad entre dos fenómenos.

Hay una razón importante por la cual la causalidad no equivale a correlación. La comparación de dos variables puede oscurecer la presencia de una tercera variable de confusión.

Una tercera variable desconocida puede afectar a otras dos variables. Puede dar la sugerencia de la presencia de una relación causal entre los dos. Nadie puede darse cuenta de la presencia de esa tercera variable y es imposible establecer la causalidad.

Cosecha de la cereza

La selección de cerezas es uno de los muchos ejemplos conocidos de visualización de datos engañosos. Este formulario de visualización de datos omite ciertas fuentes o piezas de información .

El propósito es mostrar un conjunto de resultados más limpio o más predecible y extraer una tendencia o patrón inexistente. Es deshonesto y no objetivo. Los resultados se vuelven inexactos e incompletos y no transmiten conocimiento real.

La selección de cerezas es una forma de mala visualización de datos que se ve a menudo en la industria farmacéutica. Una revisión cuidadosa puede mostrarlo en la presentación de los resultados de los ensayos clínicos. Un ejemplo serían los antidepresivos. Queda claro al comparar los datos con los resultados de las investigaciones financiadas por el gobierno de la misma droga.

El ejemplo anterior muestra cuán peligrosa puede ser la selección selectiva de datos. Un ensayo clínico puede revelar ciertas complejidades sutiles. Estos solo se pueden extraer considerando datos no adulterados.

Escala logarítmica poco clara

El valor entre dos puntos en un eje lineal es siempre el mismo. En el caso de una escala logarítmica. el valor entre dos puntos difiere según un cierto patrón. Esa es la forma más fácil de ver la diferencia entre una escala lineal y una logarítmica.

Eso no significa que una representación logarítmica sea una forma de visualización de datos engañosa. Puede ser una forma muy efectiva de extraer una relación importante en el conjunto de datos. Por supuesto, es importante mostrar que la gráfica usa una escala logarítmica. Si ese no es el caso, puede conducir a la pérdida de importancia de los datos.

Los dos gráficos siguientes muestran dos formas de presentar los mismos datos. Uno usa una escala lineal,

Fuente de imagen

mientras que el otro usa una escala logarítmica. Ambas representaciones son, en esencia, correctas, pero se ven diferentes.

La lección es que puedes usar una escala logarítmica, pero de alguna manera necesitas dejar eso claro para el espectador .

Visualización no convencional

Los elementos de visualización de datos tienen un efecto en la psicología humana . Los colores, las fuentes y los íconos tienen una cierta connotación más profunda. Influyen en la forma en que el espectador percibe la información. Ignorar o abusar de estos hechos son ejemplos engañosos de visualización de datos.

La importancia de la visualización de datos no debe subestimarse. Cuando el cerebro recibe nueva información, lleva tiempo analizar el significado de ciertos elementos de diseño.

Ser creativo es bueno y puede agregar significado a la visualización de datos. Pero no distraiga a la audiencia con aplicaciones inusuales de asociaciones visuales habituales como en este ejemplo.

o este sobre muertes por armas.

Fuente de imagen

El segundo ejemplo es uno de los peores porque es obvio lo que el fabricante está tratando de decir debajo de la superficie. Es una representación invertida poco convencional. Da la impresión de que las muertes por armas de fuego están disminuyendo en Florida cuando ocurre lo contrario.

Aquí hay otro ejemplo. Muestra un mapa de los Estados Unidos con las tasas de infección del virus por estado.

Fuente de imagen

Muestra la tarifa con diferentes colores. En mapas similares, diferentes tonos del mismo color muestran la concentración. Cuanto más oscuro es el color, mayor es la tasa de infección. Este mapa no sigue esta convención. El resultado es muy confuso y puede ser engañoso.

Gráficos circulares engañosos

Uno de los más comunes, cuando se trata de ejemplos de visualización de datos engañosos, son los gráficos circulares. Por definición, un gráfico circular completo siempre representa un total del 100 % . Esto se vuelve confuso o engañoso cuando se trata de usar gráficos circulares para mostrar los resultados de encuestas con más de una respuesta.

El ejemplo de este gráfico es correcto.

Gráfico creado con wpDataTables

Los porcentajes en el gráfico circular suman 100%. Ahora imagina una encuesta donde una de las preguntas permite a los candidatos más de una respuesta. Por ejemplo, “¿A dónde te mudarías por una mejor situación económica?” Algunos podrían dar dos respuestas, por ejemplo, Australia y Europa. Entonces un gráfico circular ya no funciona.

Si alguien usara este tipo de gráfico, la información se distorsionaría y sería inexacta. Un diagrama de Venn sería una mejor opción en este caso.

Datos acumulativos vs. anuales

Una representación acumulativa agrega entradas sucesivas. En ese caso, el gráfico sube con cada punto de datos.

Los datos anuales mostrarán los resultados de datos absolutos para un año específico. El gráfico puede subir y bajar. En algunos casos, esta podría ser una representación más honesta de los resultados.

El gráfico Worldometer COVID-19 sirve para ilustrar este punto.

Y, de hecho, los gráficos acumulativos fueron muy populares durante el período de la pandemia.

Además, muchas empresas utilizan gráficos acumulativos para mostrar sus resultados. Hace que los resultados de ventas parezcan mejores de lo que son, pero no se deje engañar.

En 2013, el CEO de Apple, Tim Cook, recibió muchas críticas porque usó una visualización de datos acumulativos para mostrar las ventas de iPad. Muchas personas sintieron que Apple trató de encubrir la disminución de las ventas de sus productos.

No hay nada de malo en mostrar representaciones de datos acumulativos si lo hace de la manera correcta. Destaca, por ejemplo, los cambios en el crecimiento. Antes de usarlo, piensa qué quieres mostrar y qué impresión quieres dar .

demasiadas variables

Debe tomar decisiones importantes cuando realiza un diseño para una representación visual de datos. ¿Qué incluyes y qué excluyes? quieres ser honesto ,   pero la presentación también debe ser clara . Cuantos más datos tenga y más interesantes los detalles, más difíciles serán las decisiones.

Este es un ejemplo de cómo no hacerlo.

El gráfico contiene demasiada información y las líneas dificultan la distinción de cualquier punto de datos. Incluso puede preguntarse si el diseñador intentó ocultar algunos datos. Si ese era el objetivo, es posible que lo hayan logrado. En cualquier caso, el resultado es inútil.

Una inspección más cercana mostró que el gráfico representaba el número y el rango de estudiantes examinados durante un largo período. El punto era que las universidades admitían más estudiantes de grupos minoritarios y de menores ingresos. La inspección mostró que dentro de estos grupos los puntajes promedio aumentaron.

Cuando empiece a trabajar en sus visualizaciones de datos, primero piense en lo que quiere mostrar y qué datos necesita para lograrlo. El número de variables de datos determinará qué tipo de visualización de datos utilizará. Así que pregúntese, ¿qué formato de datos será más efectivo para comunicar mi punto con claridad?

Uso incorrecto de gráficos 3D

No hay duda de que a su audiencia le encantarán los gráficos en 3D. Pero debe tener cuidado cuando utiliza visualizaciones de datos tridimensionales. Aquí está el por qué.

Echale un vistazo a éste ejemplo.

Fuente de imagen

Como puede ver a la izquierda, un gráfico 3D puede ocultar datos al bloquear otras partes del gráfico. Esto se debe a que un gráfico 3D imita el espacio natural. Este es un problema cuando no permite el acceso visual a puntos de datos importantes. Esto podría crear jerarquías falsas y énfasis en ciertas piezas de información.

La distorsión es otro problema asociado con las visualizaciones de datos tridimensionales. Es el resultado del escorzo. Esto es común en las imágenes porque los objetos más cercanos a nosotros parecen más grandes que los que están lejos. Pero en la visualización de datos, esto es un problema. Da la impresión de jerarquías que no existen y sesga las relaciones de datos.

Uso del tipo de gráfico incorrecto

Un gráfico circular funciona mejor cuando hay dos o tres elementos. Ese es un buen número para que el ojo humano lo distinga. La mayoría de las personas tendrán problemas para entender un gráfico circular con cuatro o más elementos. Este gráfico circular ejemplifica el punto.

Gráfico creado con wpDataTables

¿Cuál es más grande, China u otro?

Los tipos de datos específicos solicitan un tipo de gráfico específico. Ciertos tipos de gráficos son útiles para presentar datos de otro tipo. Puede encontrarse con grandes problemas cuando intenta utilizar el enfoque de visualización incorrecto.

La mayoría de las veces, el tipo de datos que tiene determina la forma en que los visualiza. En primer lugar, considere si sus datos son cualitativos (descriptivos) o cuantitativos (medidas). La información cualitativa se presta a gráficos circulares y de barras. Es mejor usar histogramas y gráficos para datos cuantitativos.

Echale un vistazo a éste ejemplo.

Muestra los mismos datos en un gráfico circular y en un gráfico de barras. El gráfico circular no es la mejor opción de visualización de datos. El gráfico de barras representa los números de una manera más precisa. Los datos en un pastel siempre suman 100%, pero ese no es el caso aquí.

No usar anotaciones

Depende de usted usar anotaciones o no. No es obligatorio hacerlo , pero es una buena práctica . Acostúmbrate a hacerlo cada vez que hagas un gráfico.

Personas con diferentes antecedentes verán sus visualizaciones de datos. Algunos solo mirarán las imágenes, otros querrán un poco más de información. Pueden necesitar texto y números para aclarar las dudas que tengan.

Aquí hay un ejemplo que ilustra el punto.

Gráfico creado con wpDataTables

Todo se ve bien y los datos se presentan correctamente. Pero, cuando observa los datos en sí, es posible que se pregunte por qué hay un aumento tan grande en 2019. Las anotaciones pueden ayudarlo a aclarar el problema.

Conclusiones después de estos ejemplos engañosos de visualización de datos

Hay muchas formas en que las personas intentan manipular y tergiversar los datos. Los 13 ejemplos de visualización de datos engañosos anteriores constituyen los más comunes.

Aprende lecciones de los errores que otras personas han cometido. Tenga la determinación de no hacer los mismos y sus tableros y presentaciones estarán libres de errores. Recuerda tener en cuenta a tu audiencia y pensar en lo que les quieres decir.

Con este conocimiento, puede representar los datos de la manera correcta y permitir que otros tomen decisiones mejor informadas.

Si disfrutó leyendo este artículo sobre ejemplos engañosos de visualización de datos, también debería leer estos:

  • Prácticas recomendadas de visualización de datos que debe conocer
  • Excelentes ejemplos de paleta de colores de visualización de datos para usar
  • Impresionantes ejemplos de visualización de datos para comprobar