Las estadísticas engañosas pueden ser peligrosas (algunos ejemplos)

Publicado: 2022-12-06

Las personas confían en las estadísticas para obtener información importante. En el mundo de los negocios, las estadísticas pueden ser útiles para rastrear tendencias y maximizar la productividad. Pero a veces las estadísticas pueden presentarse de manera engañosa . Por ejemplo, en 2007, la Autoridad de Normas Publicitarias (ADA) del Reino Unido recibió una queja sobre un anuncio de Colgate.

El anuncio afirma que el 80% de los dentistas recomiendan usar pasta de dientes Colgate. La queja que recibió la ADA argumentaba que esto era una violación de las reglas de publicidad en el Reino Unido. Después de investigar el asunto, la ADA descubrió que el anuncio utilizaba estadísticas engañosas.

Es cierto que muchos dentistas recomiendan la pasta dental Colgate. Pero no todos citaron a Colgate como su recomendación número uno. La mayoría de los dentistas también recomendaron otros tipos de pasta de dientes, y Colgate generalmente apareció en algún momento más adelante.

Este es solo un ejemplo de cómo se utilizan estadísticas engañosas. Las personas se encuentran con ejemplos de estadísticas engañosas en muchas áreas diferentes de la vida. Puedes encontrar ejemplos en las noticias, en la publicidad, en la política e incluso en la ciencia.

Esta publicación lo ayudará a aprender a reconocer estadísticas engañosas y otros datos engañosos . Se discutirá cómo estos datos engañan a las personas. También aprenderá cuándo y cómo usar los datos al tomar decisiones críticas.

¿Qué son las estadísticas engañosas?

Las estadísticas son el resultado de recopilar datos numéricos, analizarlos cuidadosamente y luego interpretarlos . Es especialmente útil tener estadísticas si se trata de una gran cantidad de datos, pero cualquier cosa que pueda medirse puede convertirse en una estadística. Las estadísticas a menudo revelan mucho sobre el mundo y la forma en que funciona.

Sin embargo, cuando esa información se utiliza indebidamente, incluso por accidente, se convierte en una estadística engañosa. Las estadísticas engañosas brindan a las personas información falsa que los engaña en lugar de informarlos .

Cuando las personas toman una estadística fuera de contexto, pierde su valor y puede hacer que las personas saquen conclusiones incorrectas. El término "estadísticas engañosas" describe cualquier método estadístico que represente datos incorrectamente. Ya sea que haya sido intencional o no , aún contaría como estadísticas engañosas.

Al recopilar datos para una estadística, hay tres puntos principales a tener en cuenta. Podría ocurrir un problema con el análisis de datos durante cualquiera de estos puntos.

  • Recopilación: mientras se recopilan los datos
  • Procesamiento: Al analizar los datos y sus implicaciones
  • Presentación: al compartir sus hallazgos con otros

Un tamaño de muestra pequeño

Las encuestas de tamaño de muestra son un ejemplo de creación de estadísticas engañosas. Las encuestas o estudios realizados en una audiencia de tamaño de muestra a menudo producen resultados que son tan engañosos que son inutilizables.

Para ilustrar, una encuesta le hace a 20 personas una pregunta de sí o no. 19 de las personas responden afirmativamente a la encuesta. Entonces, los resultados muestran que el 95% de las personas respondería afirmativamente a esa pregunta. Pero esta no es una buena encuesta porque la información es limitada.

Esta estadística no tiene valor real. Ahora, si le haces la misma pregunta a 1000 personas y 950 dicen que sí, entonces esa es una estadística mucho más confiable para mostrar que el 95 % de las personas diría que sí.

Para realizar un estudio de tamaño de muestra confiable, debe considerar tres cosas:

  • Uno : ¿Qué tipo de pregunta estás haciendo?
  • Dos : ¿Cuál es el significado de la estadística que está tratando de encontrar?
  • Y tres : ¿Qué técnica estadística utilizará?

Para tener resultados confiables, cualquier análisis cuantitativo del tamaño de la muestra debe incluir al menos 200 personas.

Preguntas cargadas

Es importante buscar datos de una fuente neutral . De lo contrario, la información está sesgada. Las preguntas cargadas utilizan una suposición controvertida o injustificada para manipular la respuesta. Un ejemplo de esto es hacer una pregunta que comience: "¿Qué es lo que te gusta?". Esta pregunta hace un gran trabajo al recopilar comentarios positivos, pero no le enseña nada útil. No proporciona ninguna oportunidad para que la persona dé sus pensamientos y opiniones honestos.

Considere la diferencia en las siguientes dos preguntas:

  • ¿Apoya una reforma tributaria que implique mayores impuestos?
  • ¿Apoya una reforma fiscal que sea beneficiosa para la redistribución social?

La pregunta se relaciona esencialmente con el mismo tema, pero los resultados de cada una de estas preguntas serían bastante diferentes. Las encuestas deben llevarse a cabo de manera imparcial e imparcial. Desea obtener las opiniones honestas de las personas y la imagen completa de lo que piensan. Para lograrlo, sus preguntas no deben implicar la respuesta ni provocar una respuesta emocional .

Citando "promedios" engañosos

Algunas personas usan el término "promedio" para ocultar la verdad o mentir para que la información se vea mejor.

Esta técnica es especialmente útil si alguien quiere que un número parezca más grande o mejor de lo que es. Por ejemplo, una universidad que desee atraer nuevos estudiantes puede proporcionar un salario anual "promedio" para los graduados de su escuela. Pero puede que solo haya un puñado de estudiantes que realmente tengan salarios altos. Pero sus salarios hacen que el ingreso medio de todos los estudiantes sea más alto. Eso se ve mejor para todo el promedio.

Los promedios también son útiles para ocultar la desigualdad. Como otro ejemplo, suponga que una empresa paga $20,000 al año a sus 90 empleados. Pero su jefe recibe $200,000 al año. Si combina el salario del jefe y el salario de los empleados, el ingreso medio de cada miembro de la empresa es de $21,978.

En el papel, eso se ve muy bien. Pero ese número no cuenta la historia completa porque uno de los empleados (el jefe) está ganando mucho más que los otros trabajadores. Entonces, este tipo de resultados cuentan como estadísticas engañosas.

Datos acumulativos vs. anuales

Los datos acumulativos rastrean la información en un gráfico a lo largo del tiempo. Cada vez que ingresa datos en los gráficos, el gráfico aumenta.

Los datos anuales presentan todos los datos de un año específico.

La información de seguimiento de cada año proporciona una imagen más real de las tendencias generales.

Un ejemplo de un gráfico acumulativo es el gráfico Worldometer COVID-19. Durante la pandemia de COVID-19, han surgido muchos ejemplos de gráficos acumulativos. A menudo reflejan el número acumulado de casos de COVID en un área específica.

Algunas empresas usan gráficos como este para hacer que las ventas parezcan mayores de lo que son. En 2013, el director ejecutivo de Apple, Tim Cook, recibió críticas por usar una presentación que mostraba solo el número acumulado de ventas de iPhone. Muchos en ese momento sintieron que había hecho esto intencionalmente para ocultar el hecho de que las ventas de iPhone estaban disminuyendo.

Esto no quiere decir que todos los datos acumulados sean malos o falsos. De hecho, puede ser útil para realizar un seguimiento de los cambios o el crecimiento y varios totales. Pero lo importante es prestar atención a los cambios en los datos. Luego analice más profundamente qué los causó en lugar de confiar en el gráfico para que le cuente todo.

Sobregeneralización y muestras sesgadas

La sobregeneralización ocurre cuando alguien supone que lo que es cierto para una persona debe ser cierto para todos los demás. Por lo general, esta falacia ocurre cuando alguien realiza un estudio con un determinado grupo de personas. Luego asumen que los resultados serán ciertos para otro grupo de personas no relacionado.

Las muestras no representativas, o muestras sesgadas, son encuestas que no representan con precisión a la población general.

Un ejemplo de muestras sesgadas ocurrió durante las elecciones presidenciales de 1936 en los Estados Unidos de América.

The Literary Digest, una revista popular en ese momento, realizó una encuesta para predecir quién ganaría las elecciones. Los resultados predijeron que Alfred Landon ganaría por goleada.

Esta revista era conocida por predecir con precisión el resultado de las elecciones. Este año, sin embargo, estaban completamente equivocados. Franklin Roosevelt ganó con casi el doble de votos que su oponente.

Algunas investigaciones más revelaron que habían entrado en juego dos variables que sesgaron los resultados.

En primer lugar , la mayoría de los participantes en la encuesta eran personas que se encuentran en la guía telefónica y en las listas de registro de automóviles. Entonces, la encuesta solo se realizó con personas de cierto nivel socioeconómico.

El segundo factor fue que quienes votaron por Landon estaban más dispuestos a responder a la encuesta que quienes eligieron votar por Roosevelt. Así que los resultados reflejaron ese sesgo.

Truncar un eje

Truncar el eje en un gráfico es otro ejemplo de estadísticas engañosas. En la mayoría de los gráficos estadísticos, tanto el eje x como el eje y presumiblemente comienzan desde cero. Pero truncar el eje significa que el gráfico en realidad inicia los ejes en algún otro valor. Esto afecta la forma en que se verá un gráfico y afectará las conclusiones que una persona sacará.

Aquí hay un ejemplo que ilustra esto:

Fuente de imagen

Otro ejemplo de esto sucedió recientemente en septiembre de 2021. En una transmisión de Fox News, el presentador usó un gráfico que mostraba la cantidad de estadounidenses que afirmaban ser cristianos. El gráfico mostró que el número de estadounidenses que se identificaron como cristianos se había reducido drásticamente en los últimos 10 años.

En el siguiente gráfico, vemos que en 2009 el 77% de los estadounidenses se identificaron como cristianos.

Fuente de imagen

Para 2019, el número disminuyó al 65%. En realidad, eso no es una gran disminución. Pero el eje de este gráfico comienza en el 58 % y se detiene en el 78 %. Entonces, la disminución del 12% de 2009 a 2019 parece mucho más drástica de lo que realmente es.

Causalidad y correlación

Puede ser fácil asumir una conexión entre dos puntos de datos aparentemente conectados. Sin embargo, se dice que correlación no implica causalidad . ¿Por qué es así?

Este gráfico ilustra por qué la correlación no es lo mismo que la causalidad.

Fuente de imagen

Los investigadores a menudo están bajo mucha presión para descubrir datos nuevos y útiles. Entonces, la tentación de adelantarse y sacar conclusiones prematuramente siempre está presente. Por eso es importante en cada situación buscar la causa y el efecto reales .

Uso de porcentajes para ocultar números y cálculos

Un porcentaje puede ocultar números exactos y hacer que los resultados parezcan más respetables y confiables de lo que son.

Por ejemplo, si dos de cada tres personas prefieren un determinado producto de limpieza, se podría decir que el 66,667% de las personas prefieren ese producto. Esto hace que el número parezca más oficial, especialmente con los números después del punto decimal incluidos.

Aquí hay algunas otras formas en que los decimales y los porcentajes pueden ocultar la verdad:

  • Ocultar números sin procesar y tamaños de muestra pequeños . Los porcentajes oscurecen el valor absoluto de los números brutos. Esto los hace útiles para las personas que desean ocultar números poco favorecedores o resultados de tamaño de muestra pequeño.
  • Uso de diferentes bases. Debido a que los porcentajes no proporcionan los números originales en los que se basan, puede ser fácil distorsionar los resultados. Si alguien quisiera hacer que un número se viera mejor, podría calcular ese número a partir de una base diferente.

Esto sucedió una vez en un informe que publicó el New York Times sobre los trabajadores sindicalizados. Los trabajadores tuvieron un recorte salarial del 20% un año, y al año siguiente el Times informó que los trabajadores sindicalizados recibieron un aumento del 5%. Entonces, el reclamo fue que les devolvieron una cuarta parte de su recorte salarial.

Sin embargo, los trabajadores recibieron un aumento del 5% en base a su salario actual, no al salario que tenían antes del recorte salarial. Entonces, aunque se veía bien en el papel, el recorte salarial del 20% y el aumento del 5% se calcularon a partir de diferentes números base. Los dos números realmente no se comparan en absoluto.

Selección de cereza/descarte de datos desfavorables

El término “recolección de cerezas” se basa en la idea de recoger solo la mejor fruta de un árbol. Cualquiera que vea esa fruta seguramente pensará que toda la fruta del árbol es igualmente saludable. Obviamente, ese no es necesariamente el caso.

Este mismo principio entra en juego en el caso del cambio climático. Muchos gráficos limitan su marco de datos para mostrar solo los cambios climáticos de los años 2000 a 2013.

Como resultado, parece que los cambios de temperatura y las anomalías son consistentes y no cambian mucho. Sin embargo, cuando das un paso atrás y miras el panorama general, queda claro dónde están los cambios y las anomalías.

Esto también ocurre en el campo de la medicina veterinaria. Cuando se les pide a los veterinarios que presenten los resultados de un nuevo medicamento de prueba, tienden a presentar los mejores resultados. En particular, si una compañía farmacéutica respalda el ensayo, solo quiere ver los mejores resultados.

Tus hermosos datos merecen estar en línea

wpDataTables puede hacerlo de esa manera. Hay una buena razón por la que es el plugin de WordPress n.º 1 para crear tablas y gráficos receptivos.

Un ejemplo real de wpDataTables en la naturaleza

Y es muy fácil hacer algo como esto:

  1. Usted proporciona los datos de la tabla.
  2. Configúralo y personalízalo
  3. Publicarlo en una publicación o página

Y no solo es bonito, sino también práctico. Puede crear tablas grandes con hasta millones de filas, o puede usar filtros y búsquedas avanzados, o puede volverse loco y hacerlo editable.

“Sí, pero me gusta demasiado Excel y no hay nada de eso en los sitios web”. Sí, lo hay. Puede usar formato condicional como en Excel o Google Sheets.

¿Te dije que también puedes crear gráficos con tus datos? Y eso es solo una pequeña parte. Hay muchas otras características para ti.

Pesca de datos

La pesca de datos, también conocida como dragado de datos, es el análisis de grandes cantidades de datos con el objetivo de encontrar una correlación. Sin embargo, como se discutió anteriormente en esta publicación, la correlación no implica causalidad. Insistiendo en que solo da como resultado estadísticas engañosas.

Puede ver ejemplos de pesca de datos en campos industriales todos los días. Una semana sale a la luz un escándalo sobre minería de datos, y una semana después es refutado por un informe aún más escandaloso.

Otro problema con este tipo de análisis de datos es que las personas eligen solo los datos que respaldan su punto de vista e ignoran el resto. Al omitir información contradictoria, hacen que los resultados parezcan más convincentes .

Gráficos confusos y etiquetas de gráficos

Cuando comenzó la pandemia de COVID-19, más personas que nunca recurrieron a las visualizaciones de datos de la propagación del virus. Las personas que nunca tuvieron que trabajar con una representación visual de las estadísticas se vieron repentinamente arrojadas al fondo de los datos estadísticos.

Además, las organizaciones a menudo intentaban obtener información de las personas rápidamente. A veces eso significaba sacrificar estadísticas precisas. Esto provocó un aumento en las estadísticas engañosas y la mala interpretación de los datos.

Aproximadamente cinco meses después de que COVID-19 comenzara a propagarse, el Departamento de Salud Pública de Georgia de EE. UU. publicó este cuadro:

El propósito del gráfico era mostrar los 5 países con los casos más altos de COVID durante los 15 días anteriores y la cantidad de casos durante un período de tiempo.

Esta tabla tiene algunos errores que hacen que sea fácil de malinterpretar. El eje x, por ejemplo, no tiene una etiqueta que explique que representa la progresión de los casos a lo largo del tiempo.

Peor aún, las fechas en el gráfico no están organizadas cronológicamente. Las fechas de abril y mayo están dispersas por todo el gráfico para que parezca que el número de casos estaba disminuyendo constantemente. Cada país también se enumera de manera que parezca que los casos estaban disminuyendo.

Más tarde, volvieron a publicar la tabla con fechas y condados mejor organizados:

Números inexactos

Otro ejemplo de estadísticas engañosas viene en forma de números inexactos. Fíjate en esta declaración de una vieja campaña de Reebok.

El anuncio afirma que el zapato trabaja los isquiotibiales y las pantorrillas de una persona un 11 % más fuerte y puede tonificar el trasero de una persona hasta un 28 % más que otras zapatillas . Todo lo que la persona tiene que hacer es caminar en zapatillas.

Esos números hacen parecer que Reebok había realizado una investigación exhaustiva sobre los beneficios del calzado.

La realidad era que esos números estaban completamente inventados. La marca recibió una sanción por utilizar estadísticas tan engañosas. También tuvieron que cambiar el comunicado y eliminar los números falsos.

Cómo evitar e identificar el mal uso de las estadísticas

Las estadísticas tienen el potencial de ser extremadamente útiles. Pero las estadísticas engañosas también tienen el potencial de confundir y engañar a las personas. Las estadísticas otorgan autoridad a una declaración y convencen a las personas de confiar en cierto argumento.

Las estadísticas sólidas y verdaderas ayudan a que las personas comprendan y las ayuden a tomar decisiones. Pero las estadísticas engañosas son peligrosas . En lugar de ayudar a las personas a evitar trampas y baches, conducen a las personas directamente a las situaciones que querían evitar.

Pero es posible identificar estadísticas y datos engañosos. Cuando te encuentres con una estadística, detente y haz las siguientes preguntas:

  • ¿De dónde vienen estos datos?
  • ¿Está controlada la fuente? ¿O es un experimento de tamaño de muestra?
  • ¿Qué otros factores podrían influir en este resultado?
  • ¿La información está tratando de informarme o me está dirigiendo a una conclusión predeterminada?

Ya sea que esté recopilando datos o esté viendo los resultados de la investigación de otros, asegúrese de que los datos sean precisos. De esa manera, no se sumará a la difusión de estadísticas engañosas .

Si disfrutó leyendo este artículo sobre estadísticas engañosas, también debería leer estos:

  • La visualización de datos interactiva más impresionante que encontrará en línea
  • Las mejores herramientas de visualización de datos de WordPress que puedes encontrar
  • Las mejores herramientas y plataformas de visualización de datos para usted