誤解を招く統計は危険な場合があります (いくつかの例)

公開: 2022-12-06

人々は重要な情報を得るために統計に頼っています。ビジネスの世界では、傾向を追跡し、生産性を最大化するために統計が役立ちます。しかし、統計が誤解を招く方法で提示されることがあります。たとえば、2007 年に英国の広告基準局 (ADA) は、コルゲートの広告に関する苦情を受けました。

この広告は、歯科医の 80% がコルゲートの歯磨き粉の使用を推奨していると主張していることで有名です。 ADA が受け取った苦情は、これが英国の広告規則の違反であると主張していました。問題を調査した後、ADA は、広告が誤解を招く統計を使用していることを発見しました。

多くの歯科医がコルゲート歯磨き粉を推奨しているのは事実です. しかし、すべての人がコルゲートを一番の推奨事項として挙げたわけではありません。ほとんどの歯科医は他の種類の歯磨き粉も推奨しており、コルゲートは通常、後である時点で登場しました.

これは、誤解を招く統計がどのように使用されるかの一例にすぎません。人々は、人生のさまざまな分野で誤解を招くような統計の例に出くわします。ニュース、広告、政治、さらには科学で例を見つけることができます。

この投稿は、誤解を招く統計やその他の誤解を招くデータを認識する方法を学ぶのに役立ちます。このデータがどのように人々を誤解させるかについて説明します。また、重要な意思決定を行う際にデータをいつ、どのように使用するかについても学びます。

誤解を招く統計とは

統計は、数値データを収集し、注意深く分析し、解釈した結果です。大量のデータを扱っている場合、統計があると特に便利ですが、測定できるものはすべて統計になる可能性があります。統計は、世界とその仕組みについて多くのことを明らかにします。

しかし、その情報が悪用されると、たとえ偶然であっても、誤解を招く統計になります。 誤解を招く統計は、人々に情報を提供するのではなく、人々を欺く虚偽の情報を提供します。

人々が統計を文脈から外すと、その価値が失われ、誤った結論を導き出す可能性があります。「誤解を招く統計」という用語は、データを誤って表す統計手法を表します。 意図的かどうかにかかわらず、誤解を招く統計としてカウントされます。

統計用のデータを収集する場合、留意すべき 3 つの原則があります。これらのポイントのいずれかで、データ分析の問題が発生する可能性があります。

収集：データ収集中
処理: データとその意味を分析する場合
プレゼンテーション: 調査結果を他のユーザーと共有する場合

小さなサンプルサイズ

サンプルサイズの調査は、誤解を招く統計を作成する 1 つの例です。サンプルサイズの聴衆に対して実施された調査または研究は、しばしば誤解を招く結果をもたらし、それらは使用できません.

たとえば、ある調査で 20 人に「はい」または「いいえ」で質問します。 19 人が調査に「はい」と答えました。その結果、95% の人がその質問に「はい」と答えることがわかりました。しかし、情報が限られているため、これは良い調査ではありません。

この統計には実際の値はありません。 1,000 人に同じ質問をして、950 人が「はい」と答えた場合、95% の人が「はい」と答えるという、より信頼性の高い統計になります。

信頼できるサンプルサイズの調査を実施するには、次の 3 つのことを考慮する必要があります。

One : どのような質問をしているのですか?
2 : 見つけようとしている統計の重要性は何ですか?
そして3 : どの統計手法を使用しますか?

信頼できる結果を得るには、サンプルサイズの定量分析に少なくとも 200 人を含める必要があります。

読み込まれた質問

中立的な情報源からデータを探すことが重要です。そうしないと、情報が偏ってしまいます。負荷の高い質問では、物議を醸す、または不当な仮定を使用して応答を操作します。この一例は、「何が好きですか」で始まる質問をすることです。この質問は、肯定的なフィードバックを収集するのに役立ちますが、有益なことは何も教えてくれません. その人が自分の正直な考えや意見を述べる機会を提供しません。

次の 2 つの質問の違いを考えてみましょう。

増税を意味する税制改革を支持しますか。
社会的再分配に有益な税制改革を支持しますか?

質問は基本的に同じ主題に関連していますが、これらの質問のそれぞれからの結果はまったく異なります。世論調査は、公平で偏りのない方法で実施する必要があります。人々の率直な意見と人々の考えの全体像を知りたいのです。そのためには、質問で答えをほのめかしたり、感情的な反応を引き起こしたりしてはなりません。

誤解を招く「平均」の引用

一部の人々は、「平均」という用語を使用して、真実を覆い隠したり、情報の見栄えを良くするために嘘をついたりします。

このテクニックは、数字を実際よりも大きくしたり、見栄えを良くしたりしたい場合に特に便利です。たとえば、新入生を引き付けたいと考えている大学は、その学校の卒業生に「平均的な」年収を提供する場合があります。しかし、実際に高給を得ている学生はほんの一握りかもしれません。しかし、彼らの給与は、すべての学生の平均収入を高くします。それは全体の平均にとってより良いように見えます。

平均は、不平等を隠すのにも役立ちます。別の例として、ある会社が 90 人の従業員に年間 20,000 ドルを支払っているとします。しかし、彼らの上司は年間20万ドルを受け取っています。上司の賃金と従業員の賃金を合計すると、会社の各メンバーの平均収入は 21,978 ドルになります。

紙の上では、それは素晴らしく見えます。しかし、従業員の 1 人 (上司) が他の従業員よりもはるかに多く稼いでいるため、その数字がすべてを物語っているとは言えません。したがって、この種の結果は誤解を招く統計としてカウントされます。

累積データと年間データ

累積データは、経時的にグラフ上の情報を追跡します。チャートにデータを入力するたびに、グラフが上昇します。

年次データは、特定の年のすべてのデータを表します。

各年の追跡情報により、一般的な傾向をより正確に把握できます。

累積グラフの一例は、Worldometer COVID-19 グラフです。 COVID-19 パンデミックの間、累積グラフの多くの例が現れました。多くの場合、特定の地域での COVID の累積症例数を反映しています。

一部の企業は、このようなグラフを使用して、売り上げが実際よりも大きく見えるようにしています。 2013年、Appleのティム・クック最高経営責任者（CEO）は、iPhoneの累計販売台数のみを示すプレゼンテーションを使用したことで批判を受けました。当時の多くの人は、iPhone の販売が減少しているという事実を隠すために、彼が意図的にこれを行ったと感じていました。

これは、すべての累積データが悪い、または間違っていると言っているわけではありません。実際、変化や成長、さまざまな合計を追跡するのに役立ちます。しかし重要なことは、データの変化に注意を払うことです。次に、チャートに頼ってすべてを説明するのではなく、原因を詳しく調べます。

過度の一般化と偏ったサンプル

過度の一般化は、ある人にとって真実であることが他のすべての人にとって真実でなければならないと誰かが仮定するときに発生します。通常、この誤謬は、誰かが特定のグループの人々を対象に研究を行ったときに発生します。次に、結果が別の無関係な人々のグループに当てはまると仮定します。

代表的でないサンプル、または偏ったサンプルは、一般母集団を正確に表していない調査です。

偏った標本の一例は、1936 年のアメリカ合衆国大統領選挙の際に発生しました。

当時の人気雑誌であったリタリー・ダイジェストは、誰が選挙に勝つかを予測するための調査を実施しました。結果は、アルフレッド・ランドンが地滑り的に勝つと予測しました。

この雑誌は、選挙の結果を正確に予測することで知られていました。しかし、今年は完全に間違っていました。フランクリン・ルーズベルトは、対戦相手のほぼ 2 倍の得票で勝利しました。

さらなる調査により、結果をゆがめた 2 つの変数が関係していることが明らかになりました。

まず、調査の参加者のほとんどは、電話帳と自動登録リストに記載されている人々でした。そのため、調査は特定の社会経済的地位の人のみを対象に実施されました。

2 つ目の要因は、ランドンに投票した人は、ルーズベルトに投票した人よりも調査に積極的に回答したことです。したがって、結果はそのバイアスを反映しています。

軸の切り捨て

グラフの軸を切り捨てることも、誤解を招く統計の例です。ほとんどの統計グラフでは、x 軸と y 軸の両方がおそらくゼロから始まります。ただし、軸を切り捨てるということは、グラフが実際に軸を他の値から開始することを意味します。これは、グラフの見え方に影響を与え、人が引き出す結論に影響を与えます。

これを示す一例を次に示します。

この別の例は、最近 2021 年 9 月に発生しました。ある Fox News 放送で、アンカーはクリスチャンであると主張するアメリカ人の数を示すグラフを使用しました。このグラフは、キリスト教徒であると自認するアメリカ人の数が過去 10 年間で大幅に減少したことを示しています。

次のグラフでは、2009 年にアメリカ人の 77% がキリスト教徒であることがわかります。

2019 年までに、その数は 65% に減少しました。実際には、大幅な減少ではありません。しかし、このグラフの軸は 58% で始まり、78% で終わります。そのため、2009 年から 2019 年にかけての 12% の減少は、実際よりもはるかに劇的に見えます。

因果関係と相関関係

接続されているように見える 2 つのデータポイント間の接続を想定するのは簡単です。しかし、相関関係は因果関係を意味しないと言われています。どうしてこんなことに？

このグラフは、相関関係が因果関係と同じではない理由を示しています。

多くの場合、研究者は新しい有用なデータを発見するという大きなプレッシャーにさらされています。そのため、銃を飛ばして時期尚早に結論を導き出そうとする誘惑は常に存在します。そのため、それぞれの状況で実際の原因と結果を探すことが重要です。

パーセンテージを使用して数値と計算を非表示にする

パーセンテージは正確な数値を隠し、結果を実際よりも評判が良く信頼できるように見せることができます。

たとえば、3 人中 2 人が特定のクリーニング製品を好む場合、66.667% の人がその製品を好むと言えます。これにより、特に小数点以下の数字が含まれているため、数字がより正式に見えます。

小数とパーセンテージが真実を不明瞭にする可能性がある他のいくつかの方法を次に示します。

生の数値と小さなサンプルサイズを非表示にします。パーセンテージは、生の数値の絶対値をあいまいにします。これは、見栄えの悪い数字や小さなサンプルサイズの結果を隠したい人にとって便利です。
異なるベースを使用。 パーセンテージは基になる元の数値を提供しないため、結果を簡単に歪めることができます。ある数字の見栄えを良くしたい場合は、別の基数からその数字を計算できます。

これは、ニューヨーク・タイムズが組合労働者について発表したレポートで一度発生しました。労働者はある年に 20% の賃金削減を受け、翌年、タイムズ紙は組合員が 5% の昇給を受けたと報告しました。つまり、減給の 4 分の 1 が返還されたという主張でした。

ただし、労働者は、減給前の賃金ではなく、現在の賃金に基づいて 5% の昇給を受け取りました。理論上は良さそうに見えたとしても、20% の賃金削減と 5% の昇給は、異なる基準値から計算されたものです。 2 つの数値は実際にはまったく比較されませんでした。

チェリーピッキング/不利なデータの破棄

「さくらんぼ狩り」という言葉は、木から最高の果物だけを摘み取るという考えに基づいています。その果実を見た人は誰でも、木の上のすべての果実が同じように健康であると考えるに違いありません. 明らかに、必ずしもそうであるとは限りません。

これと同じ原則が、気候変動の場合にも作用します。多くのチャートは、2000 年から 2013 年までの気候変動のみを表示するようにデータフレームを制限しています。

その結果、温度の変化と異常は一貫しており、あまり変化していないように見えます。一歩下がって全体像を見ると、変化や異常がどこにあるかが明らかになります。

これは獣医学の分野でも起こります。獣医が新しい治験薬の結果を提示するよう求められる場合、彼らは最良の結果を提示する傾向があります. 特に製薬会社が試験を支援している場合、彼らは最良の結果だけを見たいと思っています.

あなたの美しいデータはオンラインにする価値があります

wpDataTablesはそのようにすることができます。レスポンシブな表やグラフを作成するための WordPress プラグインとしてナンバーワンであるのには十分な理由があります。

そして、このようなことをするのは本当に簡単です:

テーブルデータを提供します
構成してカスタマイズする
投稿またはページで公開する

そしてそれは美しいだけでなく、実用的でもあります。最大数百万行の大きなテーブルを作成したり、高度なフィルターや検索を使用したり、思い切って編集可能にしたりできます。

「ええ、でも私は Excel が好きすぎて、ウェブサイトにはそのようなものはありません」. ええ、あります。 Excel や Google スプレッドシートのような条件付き書式を使用できます。

データを使ってグラフも作成できると言いましたか? そして、それはほんの一部です。他にもたくさんの機能があります。

データフィッシング

データフィッシングとも呼ばれるデータフィッシングは、相関関係を見つけることを目的とした大量のデータの分析です。ただし、この投稿の前半で説明したように、相関は因果関係を意味するものではありません。誤解を招く統計しか得られないと主張する。

産業界のデータフィッシングの事例を日々ご覧いただけます。 1 週間後にデータマイニングに関するスキャンダルが発表され、その 1 週間後にはさらにとんでもないレポートによって反駁されました。

この種のデータ分析のもう 1 つの問題は、人々が自分の見解を裏付けるデータのみを選択し、残りを無視することです。 矛盾する情報を省くことで、結果がより説得力のあるものになります。

紛らわしいグラフとチャートのラベル

COVID-19 のパンデミックが始まったとき、これまで以上に多くの人々がウイルスの拡散のデータ視覚化に目を向けました。統計の視覚的表現を扱う必要がなかった人々は、突然、統計データの深いところから放り出されました。

その上、組織は多くの場合、人々の情報を迅速に入手しようとしていました。正確な統計が犠牲になることもありました。これにより、誤解を招く統計やデータの誤解が急増しました。

COVID-19 が蔓延し始めてから約 5 か月後、米国ジョージア州公衆衛生局は次のチャートを発表しました。

このグラフの目的は、過去 15 日間で COVID の症例数が最も多い 5 か国と、一定期間の症例数を示すことでした。

このチャートには、誤解を招きやすい間違いがいくつかあります。たとえば、x 軸には、時間の経過に伴う症例の進行を表すことを説明するラベルがありません。

さらに悪いことに、チャートの日付は年代順に編成されていません。 4 月と 5 月の日付はチャート全体に散らばっており、症例数が着実に減少しているように見えます。症例が減少しているように見えるように、各国もリストされています。

その後、彼らは日付と郡を整理してチャートを再公開しました。

不正確な数値

誤解を招く統計のもう 1 つの例は、不正確な数値です。古い Reebok キャンペーンからのこの声明に注目してください。

この広告は、このシューズが他のスニーカーよりもハムストリングスとふくらはぎを 11 % 強化し、お尻を最大 28% 引き締めることができると主張しています。スニーカーを履いて歩くだけです。

これらの数字は、リーボックが靴の利点について広範な研究を行ったことを示しています.

現実には、それらの数字は完全にでっち上げでした。ブランドは、そのような誤解を招く統計を使用したことでペナルティを受けました. また、声明を変更し、偽の番号を削除する必要がありました。

統計の誤用を回避および特定する方法

統計は非常に役立つ可能性を秘めています。しかし、誤解を招く統計は、人々を混乱させ、騙す可能性もあります。統計は声明に権威を与え、人々に特定の議論を信頼するよう説得します。

確かで真の統計は、人々に洞察を与え、意思決定を助けるのに役立ちます。しかし、誤解を招く統計は危険です。人々が落とし穴や穴を避けるのを助ける代わりに、彼らは人々が避けたいと思っていた状況に人々を導きます.

しかし、誤解を招く統計やデータを特定することは可能です。統計に出くわしたら、立ち止まって次の質問をします。

このデータはどこから来たのですか？
ソースは管理されていますか？それともサンプルサイズの実験ですか？
この結果には、他にどのような要因が考えられるでしょうか?
情報は私に知らせようとしているのですか、それともあらかじめ決められた結論に私を導いているのですか?

データを収集している場合でも、他人の調査結果を表示している場合でも、データが正確であることを確認してください。 そうすれば、誤解を招く統計の拡散に加担することはありません。

誤解を招く統計に関するこの記事を楽しんで読んだ場合は、これらも読む必要があります。

オンラインで見つけられる最も印象的なインタラクティブデータビジュアライゼーション
あなたが見つけることができる最高のWordPressデータ視覚化ツール
あなたに最適なデータ視覚化ツールとプラットフォーム