※私は数学者ではありません。自分用のまとめとしてこれを書いています。楽しむ範囲でご覧いただければ幸いです。内容の正確性については専門家のサイトや動画、専門書等で必ず確認をお願いします。
* * *
前回、単位円の円周上を終点とするベクトルに相関行列を掛け、ベクトルの終点の行き先をみました。相関係数の値が0から1へ大きくなるにしたがい45°線に集まり、最大値の1をとるとき、すべてのベクトルの終点は45°線上に乗ることがわかりました。
今回はそのつづきとして、単位円の中に置かれた点それぞれに相関行列で働きかけたとき、ベクトルの終点がどこへ行くのかみます。
* * *
まず、単位円内の点を終点とするベクトルについて考えます。下図は、500本の矢印(ベクトル)の終点をカラフルな◯で表しています。
R言語のplot関数を使ったせいか単位円が少しずれてしまっています。申し訳ないです…
500個の◯それぞれは2変数 $V_1$ と $V_2$ の関係を表しています。右上のほうにある◯は $V_1$ と $V_2$ がともに正の値であることを、左上のほうにある◯は $V_1$ が負、 $V_2$ が正であることを表します。左下のほうにある◯は $V_1$ と $V_2$ がともに負であることを、右下のほうにある◯は $V_1$ が正、 $V_2$ が負であることを表します。こうした、変数どうしの関係を示すグラフを散布図といいます。
$V_1$ と $V_2$ の相関係数の値は実測で $-0.0048$、ほぼ0です。確かにこの散布図から、$V_1$ が正の値をとるとき、$V_2$ が正になるのか負になるのか判別しづらい感じです。
散布図には、赤色で単位円の直径が2本描かれています。1つは左下から右上に伸びる45°線、もう1つは左上から右下に伸びる45°線です。
* * *
相関係数を0から1へ少しずつ大きくしてみましょう。すると、散布図は次のように形を変えます。
左上:$\rho=0.2$、右上:$\rho=0.4$、左下:$\rho=0.6$、右下:$\rho=0.8$
もともと単位円の中に置かれていた500個の◯は、相関係数が高くなるにしたがい、右45°に傾いた楕円状に押しつぶされてゆきます。もう少し解像度を高くして表現すると、相関係数が高くなるにしたがい、左下から右上に向かう楕円の長径は長くなり、左上から右下に向かう楕円の短径は短くなります。500個の◯の行き先は、相関係数によって大きく異なります。
下図は、$\rho=1$ のときの散布図です。500個の◯すべてが、左下から右上に向かう45°の線分にきれいに乗ります。そして、左上から右下へ向かう線分は長さ0となり、消滅します。楕円が線分になり、次元は2から1へ縮約されます。
単位円を終点とするベクトルに相関行列で働きかけると、その終点の分布は単位円(真円)から楕円に変形します。相関係数の値が0から1へ大きくなるにしたがい楕円は押しつぶされ、最大値の1をとるとき45°線に縮約されます。
この不思議な現象をうまく記述する、ぺしゃんこの尺度とも言えるものが固有値と固有ベクトルです。これらについては次の記事で取り上げます。