前回のブログで「平均への回帰」という統計用語にふれた。
親の身長とその子が成長したときの身長の関係から、子の身長に「平均への回帰」現象がみられることを発見したゴルトンは親子の身長のような2つの変数間の関連性に思いを巡らせた。
彼はその関連性に相関ということばを用いた。
二種類のデータX,Yがあったとき,例えばXの増加とともにYも増加するような関連性が認められれば,「XとYとの間には相関がある」と表現することはご存じであろう。
ゴルトンはこの相関の強さがどの程度のものなのか数値化したかったが、かなわなかった。
ここで登場するのが彼の弟子であったカール・ピアソンだ。
統計を勉強した人は聞いたことのある名前だろう。
ピアソンは相関の程度を示すために相関係数というものを編み出して数値化した。
相関係数にはrという文字を使う。
rは-1から1の間の値をとり、中間の0に値が近いほど2変数間の関連性は薄くなる(詳しくは成書をご覧あれ)。
今日、この相関係数は「ピアソンの積率相関係数」という名前で多用されている。
調査や実験で得られたデータを分析する際,変数間の関連性、すなわち相関は最も頻繁に検討される。
相関係数を算出することで各種データ間の関連性の程度が明らかになり、因果関係を知る手がかりとなる。
ただし,相関関係=因果関係ではないので注意。