人気ブログランキング | 話題のタグを見る

データ面などファーム中心で書いているカープ応援中心の子ブログです


by manetanuki

相関係数が1に近いから、本当に関係があるとは言いきれない

『カープを強くしたい!!』さんの
年年の相関関係
というエントリ
打者のことまでは分析する気力のない私にとっても
刺激的な内容なのでありますが

ここのタイトルにしている事実があることを思い出し
・・・考え込んでしまったわけです。

あ~こりゃ難しいなあと。
まず
 2つの測定変数の間に因果関係が本当にあるのか
 の吟味の必要があるんじゃないかなあ
 →これについては
 「朝食をしっかりとる子供は学校の成績が良好」
 は見かけの相関であろうと。
 「学校の成績が良好」と「経済状態が良好」には相関があり
 「経済状態が良好」と「食生活の安定」には相関がある
 なので
 「朝食をしっかりとる子供」と「学校の成績が良好」な間に
 相関があるように見える
 という例がある
 (たしかに、相関係数は高いのだが
 朝食をしっかりとれば成績がよくなるというのは論理の飛躍なのです)
つぎに
 相関係数をだすよりも散布図でこそ見えてくることもある
ということ。
 2つの変数の相関の傾向が
 他の多数とは明らかに異なる選手のグループがいたら
 プロット図上では傾きの違うグループとして見える
 それを取り除いた後に残るデータを用いての相関係数のほうが
 元のデータに拠るよりも
 説得力のあるものである可能性が大きい
 (明らかに測定のミス、というものを取り除いて分析するべきだ
 といわれた 理科系の学生としての経験からそうおもう)


ただ、過去にデータ間の分析を行っている先人はいるので参考になりますよ。
 とっつきにくいかもしれないですが
メジャーリーグの数理科学(上)」「メジャーリーグの数理科学(下)
を読まれることをお勧めします。

上巻に1998年と1999年におけるアメリカンリーグのレギュラー選手の出塁率の散布図
が載っています。


 
 

 
by manetanuki | 2008-03-01 13:53