【統計学入門】統計の身近な例をなるべく簡単に面白く解説

統計学

この記事では「生活の中にある身近なものを、統計学によって、なるべく簡単に面白く解説すること」を目的としています。

また、統計の知識を持つことは世の中に氾濫するデータを正しく判断し、取捨選択する能力に直結するので、現代社会を上手く生きていくには、統計の知識がとても役に立ってくるものだと思います。

1.ネット調査の罠

ネットの発展とともにサンプル調査をインターネットで調査することが多くなってきました。ただ、ネット調査にはメリットとデメリットが存在することを知らないと、色々な不都合を被ることとなるでしょう。

<メリット>

調査がとても早くしやすいということ。面接調査のように色々な手間がいらないので、比較的にすぐ終わります。また、費用も他の調査方法に比べて安く済みやすいというメリットがあります。

<デメリット>

ネット調査に答える人たちのサンプルが、母集団の代表の役割を果たせないことがあるということ。なぜなら、ネットを使わない層の人々が調査から抜けてしまうため、若い人の声が大きくなり、中高年の人の意見が反映されにくくなってしまうからです。

2.少数の法則

少数の法則と調べると様々な意味が出てきますが、「サンプルの数が少ないのにも関わらず、法則性を当てはめようとする思考に繋がってしまう。」というのも少数の法則と呼ばれています。

これはどういう意味かというと、例えばコインを投げて表が連続で5回出たとしましょう。その時に、コインは表と裏が出る確率は五分五分なのだから、流石にまた表が出ることは無いだろう。といった思考のことです。

ただ、これには間違いがあって、コインを振る試行を無限回行って、初めてコインの表と裏が出る確率が五分五分になるという事が分かるのであって、上に挙げたような考え方は、少数の法則に上手く踊らされてしまっています。

3.平均値と中央値

平均値は聞き馴染みのある言葉ですが、中央値は聞いたことが無いという人がいるかもしれません。中央値とは真ん中の順位の値のことで、例えば7人が受けたテストの得点の中央値は上位4位の人の得点です。

そして、この平均値と中央値は一見あまり変わらない値だと思いますが、大きく変わるケースがあります。一つの例として挙げられるのが、国民の所得についてです。

上図は厚生労働省が2019年に調査した国民生活基礎調査の概況です。

この図の中央値と平均値に注目してほしいのですが、100万円以上離れていることが分かると思います。これはなぜかというと、少数ながら2000万円以上の所得がある人たちがいて、中には億単位の所得がある人もいるので、こういう人たちが平均値を上げているのです。

このように、平均値は他の値から大きく離れた値(外れ値)に影響されてしまうという特徴があります。しかし、中央値はこういった外れ値による影響を受けにくいのが特徴です。

そのため、データを分析することは平均値だけでなく、中央値も確認することが大事です。

4.相関関係の罠

相関関係という言葉があります。相関関係とは一方が変わると、もう片方が変わるといった関係のことです。ただ、これを因果関係とはとらえてはいけません。例えば、年代別の男性のBMIと女性のBMIを散布図にとってみると、相関関係が見られるそうです。(年を取るごとに男性の体重が増えると、女性の体重が減る。)

ただ、年代別男女の体重の関係性に因果関係があるとするのは明らかに間違っています。ですので、相関関係が示されたと言って、即座に因果関係があると早とちりしないようにすることも、データを分析する上では大事です。

5.(まとめ)確証バイアスに陥らないために

自分にとって都合の良い情報を過信して、不都合な情報を無視する傾向を確証バイアスと言い、確証バイアスは正しくデータを読み取るのを妨げます。しかし、今回解説したような統計に関する知識を付けていけば、確証バイアスに陥らずに、データを的確に分析して、有効に活用できるようになると思います。

ですので、統計の知識を付けることは、正しい情報を集め、また説得力のあるデータを提示する能力に直結するので、とても役に立つものになると思います。

以下のページでは、統計学の重要な概念である正規分布と言うものを紹介しています。

統計学の重要概念「正規分布」を実際例を踏まえて解説
※※すいません。この記事は中途半端なところで終わってしまってます。情報収集には向いていないので、それでも良い方はお読みくださいませ。※※ 前回の記事では、統計の身近な例をなるべく分かりやすく解説しました。 前回は入門的な...

6.引用文献

厚生労働省、「2019年 国民生活基礎調査の概況」(参照 2021/10/8)https://www.mhlw.go.jp/toukei/saikin/hw/k-tyosa/k-tyosa19/index.html

門倉貴史「本当は嘘つきな統計数学」、幻冬舎新書、二〇一〇年

神永正博「ウソを見破る統計学 退屈させない統計入門」、講談社ブルーバックス、二〇一一年

五十嵐中、佐條麻里「統計学わかりません!!」、東京図書、二〇二〇年

コメント

タイトルとURLをコピーしました