なぜスポーツ選手には4月~9月生まれが多いのか…統計のプロが不利な早生まれの人にするアドバイス

2024年3月8日(金)18時15分 プレジデント社

※写真はイメージです - 写真=iStock.com/Dmytro Aksonov

写真を拡大

データを正しく読み解くにはどうすればいいか。データ分析・活用コンサルタントのサトウマイさんは「2018年度の日本のプロ野球選手(NPB)、プロサッカー(J1)、プロバスケットボール選手(B1)の生年月日を収集して結果を見たところ、4〜9月生まれが多く、1〜3月生まれが少ない傾向があった。データを見ると、『春に生まれた子どものほうがスポーツ選手になりやすいのか?』と思うが、『春に生まれる→スポーツ選手になりやすい』という直接的な因果関係はない。このように相関関係を因果関係と混同してしまうのは『錯誤相関』である」という——。

※本稿は、サトウマイ『はじめての統計学 レジの行列が早く進むのは、どっち⁉』(総合法令出版)の一部を再編集したものです。


写真=iStock.com/Dmytro Aksonov
※写真はイメージです - 写真=iStock.com/Dmytro Aksonov

■数字はウソをつかないが、人間はウソをつく


クイズです。以下の中で、正しいものはどれでしょうか?


①警察官が多い地域は、犯罪件数が多い
②アイスが売れる日は、水辺で事故がよく起きる
③体重が重い小学生ほど、足が速い

答えは、「すべて正しい」です。


「え、そうなの?」と思った方、統計のトリックに騙されています。世の中には、「これをすればこうなりますよ」というような、謳(うた)い文句であふれています。


しかし、それをそのまま鵜呑(うの)みにしてはいけません。


ご丁寧に、モニターさんのビフォーアフターの写真が載っていたら、「私もこうなれるかも!」と信じてしまいがちですが、一旦立ち止まりましょう。データそのものは正しくても、見せ方ひとつで、人の印象を操作することができるからです。


数字はウソをつきませんが、人間はウソをつきます。


データ社会では、数字のウソを見破れるようにならなければいけません。空き巣の対策を取るなら空き巣の手口を知る必要があるように、数字に騙されないためには数字による騙し方を学ぶ必要があるのです。


■データとしては正しくても解釈が違う


まずひとつ目の「警察官が多い地域は、犯罪件数が多い」ですが、データとしては「正しい」です。


では、「警察官を減らせば、犯罪は減るということ?」という解釈は正しいでしょうか? 答えは「ノー」です。


こういったデータになる理由のひとつに、「人口が多い地域ほど警察官は多い。人口が多い地域ほど犯罪件数は多い。よって、警察官が多い地域は犯罪件数が多くなる」ということです。


これは、本書で説明している「毎年あの宝くじ売り場で高額当せんが出るのは本当なのか」が数学法則としては正しいが、当たる数と当たる確率は別物である、という話と同じです。


2つ目の例、「アイスが売れる日は、水辺で事故がよく起きる」ですが、こちらもデータとしては「正しい」です。


では、「アイスを売らなければ、水辺での事故は減る」のでしょうか? 答えは「ノー」です。


アイスがよく売れる日というのは夏場です。夏場は、海水浴や川遊び、プールなどへ出かける人が多いため、水辺の事故の件数が多くなります。アイスの販売を規制したからといって、事故の抑止にはつながらないでしょう。


■本当の原因ではないものを操作しても、結果には影響しない


3つ目の例、「体重が重い小学生ほど、足が速い」ですが、こちらもデータとしては「正しい」です。


では、「たくさん食べて太れば、足が速くなるのでは?」という解釈は正しいでしょうか? 答えは「ノー」です。


体重が重い児童は、高学年に多いですよね。高学年の児童は、低学年の児童よりも足が速いです。したがって、「体重が重い小学生ほど、足が速い」という関係になるということです。


わかりましたか? ひとつ目の例では、「人口」が、2つ目の例では「季節(気温)」が、3つ目の例では「学年(年齢)」が、本当の原因として隠れていました。本当の原因ではないものを操作しても、結果には影響しないのです。


このように、相関関係を因果関係と混同してしまうことを「錯誤相関(さくごそうかん)」といいます。


出所=『はじめての統計学 レジの行列が早く進むのは、どっち⁉

相関というのは、2つの値の関係性のことです。


例えば、身長と体重は相関関係です。身長が高い人ほど、体重が重くなります。身長と体重の散布図を描くと図表1のようになります。直線的に右肩上がりになっているのがわかるでしょうか?


これを「正の相関」といいます。一方が増えると、もう一方も増えるような関係性です。


■平均気温が低い地域ほど、雪日数が多くなるのは「負の相関」


図表2は、2016年の各都道府県の年間平均気温と雪日数の散布図です。見ると、右肩下がりのグラフになっています。これは平均気温が低い地域ほど、雪日数が多くなるためです。


このように、一方が下がると、もう一方が上がるような関係を「負の相関」といいます。「相関がない」場合には、2つの値には「なんらかの結びつきがあるとはいえない」と考えます。


出所=『はじめての統計学 レジの行列が早く進むのは、どっち⁉

2つの値の関係性の度合いを表す指標を「相関係数」といいます。相関係数は、−1〜1の値で表され、関係性が強い値ほど絶対値が1に近づきます(図表3)。


出所=『はじめての統計学 レジの行列が早く進むのは、どっち⁉

一般的には、相関係数が0.5以上であれば、相関が強いと判断されることが多いです。


これはどのくらいの関係性の強さかというと、「親の身長と子どもの身長の相関係数」がだいたい0.4〜0.5といわれています。


相関係数の値は、エクセル関数ひとつでも簡単に計算することができますが、その分、解釈を間違える人がかなり多いのです。


■相関を使って人を騙す方法


冒頭のクイズで出した3つの例は、「2つの値の相関が強いもの」です。


しかし、相関関係にあるからといって、それは「因果関係になっているとは限らない」ということに注意が必要です。


例えば、


警察官が多い地域は、犯罪件数が多い

ここで出てくる2つの数値は、以下の通りです。


・その地域の警察官の数
・その地域の犯罪件数


確かに、両者は相関関係にあるものの、「警察官の数(原因)→犯罪件数(結果)」という関係性にはなってはいません(完全に因果関係がないといいきることはできませんが、論理的に考えるとおかしい)。


「その地域の人口」という見えない第三の変数が、両者の本当の原因なのです。


②アイスが売れる日は、水辺で事故がよく起きる
③体重が重い小学生ほど、足が速い


も同様に、それぞれ「季節(気温)」「学年(年齢)」が、第三の変数です。


このように、見えない第三の変数のことを「潜伏変数」といいます。潜伏変数によって、単なる相関関係を因果関係と見誤ることがよくあり(錯誤相関)、この関係を「見かけの相関」や「疑似相関」といいます。


統計に明るくない人は、相関関係と因果関係を混同して説明しているときがあるので気をつけましょう(相関関係と因果関係を明確に区別して説明しているビジネスパーソンのほうが少ない、という感覚を持っています)。


■「第三の変数は何か?」と考えるクセをつける


初心者でも簡単にできる手法だからこそ、スーパー初心者に対して「それっぽく」見せるようにできるともいえます。


例えば、「ワインの摂取量と年収に相関関係があります! ワインを飲もう!」という提案をされたとして、「そうなんだ! じゃあ、今日からワインを飲む!」と考えるのは安易すぎます。


そもそも高級なワインを買えるだけの経済力がある人だから、ワインをよく飲んでいるのかもしれません。


同様に、「成功者ほど高級時計をしている」というデータがあったときに、「高級時計を買うと成功者になれる」という解釈は、いかがなものでしょう。


「成功者だから高級時計を買っているのでは?」という「因果関係が逆じゃない?」というパターンも、錯誤相関の例です。


このように、ただの相関関係をまるで因果関係があるかのように見せて、統計に疎い人を騙すことができてしまうのです。


相関係数は、統計分析の中でも初心者が手を出しやすい最も簡単な手法ですが、誤解されやすいものでもあるので取り扱いには注意が必要です。そして、騙されないようにしましょう。


具体的には、「2つの事柄は相関があります」という主張やデータを見たときに、「これは疑似相関ではないか? 第三の変数(本当の原因)は何か?」と考えるクセをつけるといいでしょう。


■スポーツ選手に早生まれが少ない理由


それでは、少し練習をしてみましょう。


以下に相関関係の例を示します。なぜ、相関関係になっているのか考えてみてください。


①明かりをつけたまま眠る子どもは近視になる
②理系の人は、薬指が人差し指より長い
③スポーツ選手には早生まれの人が少ない

解説していきます。


①明かりをつけたまま眠る子どもは近視になる

部屋の明かりと近視には、医学的には直接的な因果関係はないといわれています。近視は遺伝の影響が大きいようです。


近視の親は遅くまで明かりをつけていることが多いので、データを取るとこのような関係になるようです。明かりをつけて眠ることは子どもの視力には影響しないだろう、というのが現時点での見解です。


②理系の人は、薬指が人差し指より長い

理系は、男子学生の割合が多いです。そして、男性はテストステロンという男性ホルモンが多いです。


女性にもありますが、男性より少ないです。「テストステロンが遺伝的に多い人は、薬指が人差し指より長い」ということがわかっています。


③スポーツ選手には早生まれの人が少ない

日本のスポーツ選手5000人のデータを分析したところ、意外な結果となりました。


取得したデータは、スポーツの種類、選手の出身地、生年月日、性別、所属チーム、ポジション、身長、体重といったさまざまな属性データを抽出して分析しました(図表4)。


出所=『はじめての統計学 レジの行列が早く進むのは、どっち⁉

このデータから、2018年度の日本のプロ野球選手(NPB)、プロサッカー(J1)の1395人の生年月日を収集して結果を見たところ、4〜9月生まれが多く、1〜3月生まれが少ない傾向がわかりました。


プロバスケットボール選手289人(B1)も加えてみましたが、同じ結果となりました。


「そもそも出生月に偏りがあるのでは?」と思い、過去50年の人口統計と出生月の比率で比較してみましたが、人口統計とプロスポーツ選手のデータに乖離(かいり)があったので、スポーツ選手特有の傾向があるといえそうです。


データを見ると、「春に生まれた子どものほうがスポーツ選手になりやすいのか?」と思いますが、「春に生まれる→スポーツ選手になりやすい」という直接的な因果関係はないかと思います。


子どもの頃を思い出してください。確かに勉強ができたり運動ができたりする子は、春〜夏生まれの子が多かったような気がします。しかしそれは、ほかの子と比べて勉強や運動を経験する時間が長いからだとされています。


■人の性格の半分は遺伝、半分は人間関係で決まる


1〜3月の早生まれの子どもは、努力をするとか、自分に自信をつける場所に身を置くことが大事でしょう。


実は、人の性格の半分は遺伝で決まることがわかっています。残り半分は、ほとんど人間関係で決まるといわれています。


心理学の世界で最も信頼できるといわれている性格分析手法に、「ビッグ・ファイブ分析」があります(図表5)。


出所=『はじめての統計学 レジの行列が早く進むのは、どっち⁉

5つの性格特性があり、中でも最も仕事の成果と結びついている性格特性が「誠実性」といわれています。コツコツと努力ができる性格特性のことです。企業の採用試験でも、誠実性を重視するところが増えてきました。


誠実性は、後天的に伸ばしやすい能力ともいわれています。誠実性を伸ばすための最も簡単な方法とされているのが、「誠実性の高い人と一緒にいること」です。


春〜夏生まれの子どもは、早生まれの子どもに比べて、成果を出している人たち(誠実性の高いと推測される人たち)と一緒にいる環境が多いので、必然的に成果を出せるような性格になっているのではないでしょうか。


■変えられないものを受け入れ、人生をハンドリングする


いかがでしたか?


「2つの事柄は相関関係にある」と一口にいっても、その時点では「なんらかの結びつきがある」くらいしかいえないのです。相関関係には、6つのパターンが存在します。


①事柄Aが事柄Bの直接原因→因果関係


②事柄Bが事柄Aの直接原因→因果関係が逆になっている


③事柄A・事柄Bが互いの直接原因
→売上(事柄A)の20%を広告費(事柄B)にしている、というような場合
(売上が増えると広告費も増えて、広告費が増えるから、また売上も増える)。


④事柄Aが事柄Bの間接原因
→風が吹く(事柄A)→〜(諸々)〜→桶屋が儲かる(事柄B)
風が吹くと桶屋が儲かるのは0.8%といわれています。
相関があることを重ねていけば、すごく相関があることにはなりません。
むしろ、逆です。


⑤第三の変数が両者(事柄Aと事柄B)の原因
→年齢(第三の変数)→体重(事柄A)かつ年齢(第三の変数)→足の速さ(事柄B)。


⑥単なる偶然
例として、
・「首つり自殺数」と「アメリカの科学・宇宙・テクノロジーに関する支出」
・「水泳プールでの溺死数」と「ニコラス・ケイジの映画出演数」
・「アメリカ人1人あたりのチーズ消費量」と「ベッドシーツに絡まって死亡する数」
などがあります。


「2つの事柄は相関がある」や「事柄Aをすると事柄Bになるらしいよ!」と聞いたときには、この6つのうち、「どれがもっともらしいか?」を検証するようにしましょう。直接的な因果関係になっているものは、意外と少ないのです。



サトウマイ『はじめての統計学 レジの行列が早く進むのは、どっち⁉』(総合法令出版)

そして、「因果関係になっているかどうか」も大事なのですが、「それがコントロール可能か?」という点も忘れないようにしてください。


例えば、「××遺伝子を持っている人は、糖尿病になりやすい」ということがわかっているとしましょう。しかし、そういった因果関係がわかったところで、自分ではコントロールできないこともあります。


その場合、自分が後天的にコントロールできる点で努力するしかありません。


具体的には、「良い生活習慣を送る」ということになるでしょう。あらゆる場面において、自分では変えられないものを受け入れつつ、コントロールができるところをハンドリングしていきましょう。


----------
サトウマイ(さとうまい)
データ分析・活用コンサルタント
合同会社デルタクリエイト代表社員。国立福島大学経済経営学類卒業。一般企業就職後、26歳で独立、データ分析・統計解析事業を始める。現在は企業のマーケティングリサーチや需要予測調査、商品開発支援などを行っている。数学アレルギーから学生時代より文系の道に進むが、統計学と出会いアレルギーを克服。株式会社野村総合研究所主催の「マーケティング分析コンテスト」入賞。学生や社会人向けに、データ分析をリアル謎解きとして楽しみながら、仕事に役立つ実践的なトレーニングを行っている。
----------


(データ分析・活用コンサルタント サトウマイ)

プレジデント社

「スポーツ選手」をもっと詳しく

「スポーツ選手」のニュース

「スポーツ選手」のニュース

トピックス

x
BIGLOBE
トップへ