2025年1月31日

固有値の和と積(トレースと行列式)

※私は数学者ではありません。自分用のまとめとしてこれを書いています。楽しむ範囲でご覧いただければ幸いです。内容の正確性については専門家のサイトや動画、専門書等で必ず確認をお願いします。


*  *  *


前回、固有値分解について学びました。潜在的にはかなり高度な内容を含みますが、私たち文系がここちよく感じられるようにまとめたつもりです。今回は、固有値の和(トレース)と積(行列式)を通して固有値分解の理解を深めたいと思います。


*  *  *


固有値の和

今回も相関行列を例にします。

$$\begin{pmatrix} 1 & \rho \\ \rho & 1 \end{pmatrix}$$

前回みたように、相関行列の固有値は

$$\lambda_1=1+\rho, \qquad \lambda_2=1-\rho$$

これらの和は

$$\lambda_1+\lambda_2=(1+\rho)+(1-\rho)=2$$

この2という値は、固有値分解した元の行列の対角要素の和と等しいです。相関行列の左上の対角要素は1、右下の対角要素も1ですので、対角要素の和は確かに2です。

行列の対角要素の和をトレースといいます。固有値の和がトレースであるというのは、相関行列だけでなく、行列一般に成り立つ不思議な性質です。

鋭い人は、「固有値には非対角要素である $\rho$ が織り込まれ、トレースには非対角要素が全く関わらないのに、固有値の和が対角要素の和と等しくなるのはなぜですか?」という疑問を持つかもしれません。

相関行列の例は、この問いに明確な回答を与えます。すなわち、「確かに固有値には非対角要素である $\rho$ が織り込まれているが、和を計算する過程で相殺される」という回答です。これは2次方程式の解の公式に $\pm$ がある(2次方程式の対称性)ことから理解できます。

※2次方程式の解の公式については、こちらこちらを参照してください。


*  *  *


前回の記事に次のような段落があります。

2つの固有値の和は、相関係数の値によらず、元の相関行列の対角要素の和である2に等しくなります相関係数が0から1に近づくにしたがい、↘︎成分が↗︎成分に吸い取られるイメージです。相関係数が1のとき、↘︎成分は完全に↗︎成分に吸い取られます。

オレンジ色にした文節はトレースの性質を表しています。それぞれの固有値は非対角要素である $\rho$ に影響を受けますが、それらは相殺されトレースは2のままです。「行く川の流れは絶えずして、しかももとの水にあらず」といいますか、不易と流行が溶け合ったものが固有値です。


*  *  *


固有値の積

つづいて固有値の積についてみます。相関行列の固有値の積は

$$\lambda_1\lambda_2=(1+\rho)(1-\rho)=1-\rho^2$$

これが何か、にわかに判然としないかもしれません。しかし、相関行列で働きかけた後のベクトルの(伸縮)倍率が固有値であることを思い出してみましょう。すると、固有値の積($\lambda_1\lambda_2$)は、働きかけた後のベクトルから生成される平行四辺形の面積と、対応する固有値を掛けて伸び縮みさせたベクトルから生成される平行四辺形の面積との倍率であることに気づきます。

やさしく言い換えましょう。「1cm四方の正方形の面積は1です。この正方形を横に3倍、縦に2倍引き伸ばした長方形の面積は元の正方形の面積の何倍ですか?」答えは明らかに「$3\times 2=6$ だから6倍」ですよね。

同様に、「相関行列で変換した後のベクトルが生成する平行四辺形の面積が1であるとしましょう。この平行四辺形を横に $1+\rho$ 倍、縦に $1-\rho$ 倍引き伸ばした平行四辺形の面積は元の平行四辺形の面積の何倍でしょうか?」答えは明らかに「$(1+\rho)(1-\rho)$ だから$1-\rho^2$」です。同じことです。要するに、「固有値で2辺を伸び縮みさせた平行四辺形の面積は、元の平行四辺形の何倍ですか?」、固有値の積はこの問いの答えです。

実は、この問いの答えを求めるもう1つの式があります。それが行列式です。行列式は、行列の要素のたすき掛けの差です。相関行列の要素を用いて式を書くと

$$1\times 1-\rho\times\rho=1-\rho^2$$

確かに、計算結果は固有値の積と等しいです。

固有値がベクトルの伸縮倍率であることに気づけば、固有値の積が平行四辺形の面積の倍率であることもすぐにわかります。ここまでたどりつければ、固有値の積が行列式の計算結果と等しいのは当たり前に思えます。


*  *  *


相関係数は $-1$ から $+1$ の間の値をとります。さまざまな相関係数の値に対応する変換後のベクトルと、それらから生成される平行四辺形をアニメーションにしてみました。相関係数が $-1$ から $+1$ に向かうと平行四辺形の色はオレンジに変わります。相関係数が0のとき平行四辺形は正方形となり、面積は最大値の1となります。相関係数の絶対値が0から1へ向かうにしたがい、平行四辺形は押しつぶされ、面積は0に向かって小さくなります。



*  *  *


固有値は、固有方程式といわれるものの解です。2×2行列 $A$ の2つの固有値を $\lambda_1,  \lambda_2$ とおき、単位行列を $E$、すべての要素が0である零行列を $O$ とおくと、特性方程式は

$$(A-\lambda_1E)(A-\lambda_2E)=O$$

となります。これを展開すると

$$A^2-(\lambda_1+\lambda_2)A+\lambda_1\lambda_2E=O$$

固有値の和はトレース、固有値の積は行列式ですので、これらを代入すると

$$A^2-tr(A)A+det(A)E=O$$

これをケーリー=ハミルトンの定理といいます。これまで学んだことが1つの式にコンパクトに収まるのはすごいですね。詳細は、岩田利一『行列と行列式1』岩波講座 現代数学への入門, 岩波書店, pp.34-37を参照してください。


※固有値の和であるトレースと、固有値の積である行列式は、ヴィエトの公式という多項式の知見の応用だそうです。このブログの範囲をはるかに超えますので、名前だけ紹介しておきます。



2025年1月30日

向きと強さへの二極分解(固有値と固有ベクトル)

※私は数学者ではありません。自分用のまとめとしてこれを書いています。楽しむ範囲でご覧いただければ幸いです。内容の正確性については専門家のサイトや動画、専門書等で必ず確認をお願いします。


*  *  *


前回、単位円内を終点とするベクトルに働きかけたとき、行き先がどこになるのか考えました。相関行列の働きかけにより、単位円(真円)は傾いた楕円に押しつぶされ、究極的には45°線になりました。

今回は、この押しつぶしと傾きの尺度(ぺしゃんこの尺度)とも言うべき、固有値と固有ベクトルを紹介します。文系の私たちも、ゼミナールや演習科目で主成分分析をしたり、証券ポートフォリオの効率的フロンティアを描いたりする機会があります。そうした場面にも幅広く応用されます。

少々天下り的な説明になりますが、計算結果と図表を対応させることでイメージは掴めるのではないかと思います。


*  *  *


私たち文系にとって、固有値と固有ベクトルは次のようなものです。

  • 固有ベクトル:行列の働きから向きを取り出したもの
  • 固有値:行列の働きから強さを取り出したもの


ここでは、相関行列を例に固有ベクトルと固有値についてみます。

$$\begin{pmatrix} 1 & \rho \\ \rho & 1 \end{pmatrix}$$


*  *  *


固有ベクトル

下図は前回のグラフです。私たちが中学生の頃から慣れ親しんだ座標平面は、相関行列の働きによって反時計回りに45°回転します。座標平面の横軸は左下から右上に向かう線に、縦軸は左上から右下に向かう線に45°ずつ回転します。


このことから、相関行列の固有ベクトルは、原点から右上45°に向かう長さ1のベクトルと、原点から右下45°に向かう長さ1のベクトルの2本であることがわかります。

まず、右上45°に向かう固有ベクトルについて考えます。45°は、小学生のとき使った太っちょの三角定規の底辺と斜辺を挟む角度です。したがって、固有ベクトルはこの三角定規の斜辺にそって原点から1進むベクトルになります。

太っちょの三角定規の3辺の長さの比は横:縦:斜辺$=1:1:\sqrt{2}$ ですが、固有ベクトルの長さは1ですので、斜辺の長さが1になるように調整します。すると

横:縦:斜辺 $=\frac{1}{\sqrt{2}}:\frac{1}{\sqrt{2}}:1$

これで、原点から右上45°に向かう固有ベクトルの終点の座標は $(\frac{1}{\sqrt{2}}, \frac{1}{\sqrt{2}})$ だとわかりました。よって、1つめの固有ベクトルは

$$\begin{pmatrix}  \frac{1}{\sqrt{2}}  \\  \frac{1}{\sqrt{2}} \end{pmatrix}$$

つづいて、右下に向かう固有ベクトルについて考えます。原点から右下45°に向かう長さ1のベクトルの終点の座標は $(\frac{1}{\sqrt{2}}, -\frac{1}{\sqrt{2}})$ です。よって、2つめの固有ベクトルは

$$\begin{pmatrix}  \frac{1}{\sqrt{2}}  \\  -\frac{1}{\sqrt{2}} \end{pmatrix}$$

2つの固有ベクトルをくっつけ、共通の係数 $\frac{1}{\sqrt{2}}$ を行列の外に出すと

$$\begin{pmatrix} \frac{1}{\sqrt{2}} & \frac{1}{\sqrt{2}} \\ \frac{1}{\sqrt{2}} & -\frac{1}{\sqrt{2}} \end{pmatrix}=\frac{1}{\sqrt{2}}\begin{pmatrix} 1 & 1 \\ 1 & -1 \end{pmatrix}$$

この行列は、私たちが慣れ親しんだ横軸と縦軸からなる座標平面に相関行列を働きかけると、反時計回りに45°傾くことを表します。固有ベクトルは、行列に備えられた向きの働きを浮かび上がらせます。


*  *  *


固有値

前回、相関行列に入力される相関係数が0から1へ大きくなるにしたがい、500個の◯の分布は単位円(真円)から楕円に押しつぶされることをみました。前回のグラフを再掲します。

左上:$\rho=0.2$、右上:$\rho=0.4$、左下:$\rho=0.6$、右下:$\rho=0.8$ 


楕円の長半径(右上45°に伸びる長いほうの半径)は、真円である単位円の1からしだいに伸び、相関係数が1のとき2になります。短半径(右下45°に伸びる短いほうの半径)は、単位円の1からしだいに縮み、相関係数が1のとき0になり消滅します。

長半径への引き伸ばし倍率を $\lambda_1$、短半径への収縮倍率を $\lambda_2$ とおきます。$\lambda_1$ と $\lambda_2$ を $\rho$ による最もやさしい式で表すと

$$\lambda_1=1+\rho, \qquad \lambda_2=1-\rho$$

$\lambda_1$ は $\rho$ が0のとき1であり、$\rho$ が1に近づくにしたがい2に近づきます。これは長半径の引き伸ばしの特徴をうまく捉えています。同様に、$\lambda_2$ は $\rho$ が0のとき1であり、$\rho$ が1に近づくにしたがい0に近づきます。これも短半径の収縮の特徴をうまく捉えています。実は、これが行列に備えられた強さを取り出す固有値です。

右上45°に向かう固有ベクトルは相関係数が大きくなるにしたがい強く(倍率が高く)なり、右下45°に向かう固有ベクトルは相関係数が大きくなるにしたがい弱く(倍率が低く)なります。

2つの固有値の和は、相関係数の値によらず、元の相関行列の対角要素の和である2に等しくなります。相関係数が0から1に近づくにしたがい、↘︎成分が↗︎成分に吸い取られるイメージです。相関係数が1のとき、↘︎成分は完全に↗︎成分に吸い取られます。

左上の対角要素に $\lambda_1$、右下の対角要素に $\lambda_2$ をもつ行列を作ると次のようになります。大変興味深いことに、相関行列では非対角要素にあった $\rho$ が対角要素に来ています。

$$\begin{pmatrix} 1+\rho & 0 \\ 0 & 1-\rho \end{pmatrix}$$


*  *  *


固有値分解

ここまでで、行列の働きから向き(傾き)を取り出したものが固有ベクトルであり、強さ(伸縮)を取り出したものが固有値であることがわかりました。元の行列に混在している向き強さの2極を "電気分解" で取り出す作業を固有値分解といいます。

下式は相関行列を固有値分解したものです。(右辺の左右の行列は同じにみえますが、右の行列は左の行列の逆行列です。対称かつ直交な行列ですので、元の行列=転置行列=逆行列となります。)

$$\begin{pmatrix} 1 & \rho \\ \rho & 1 \end{pmatrix}=\frac{1}{\sqrt{2}}\begin{pmatrix} 1 & 1 \\ 1 & -1 \end{pmatrix}\begin{pmatrix} 1+\rho & 0 \\ 0 & 1-\rho \end{pmatrix}\frac{1}{\sqrt{2}}\begin{pmatrix} 1 & 1 \\ 1 & -1 \end{pmatrix}$$

係数 $\frac{1}{\sqrt{2}}$ が2つありますので、掛けて $\frac{1}{2}$ にしてしまいましょう。

$$\begin{pmatrix} 1 & \rho \\ \rho & 1 \end{pmatrix}=\frac{1}{2}\begin{pmatrix} 1 & 1 \\ 1 & -1 \end{pmatrix}\begin{pmatrix} 1+\rho & 0 \\ 0 & 1-\rho \end{pmatrix}\begin{pmatrix} 1 & 1 \\ 1 & -1 \end{pmatrix}$$

この等式が成り立つか確かめてみます。右辺の3つの行列の積は、はじめの2つを掛け、その結果に一番右の行列を掛けて求めます。まずはじめの2つの行列を掛けます。

$$\begin{pmatrix} 1 & 1 \\ 1 & -1 \end{pmatrix}\begin{pmatrix} 1+\rho & 0 \\ 0 & 1-\rho \end{pmatrix}=\begin{pmatrix} 1+\rho & 1-\rho \\ 1+\rho & -(1-\rho)\end{pmatrix}$$

この計算結果に一番右の行列を掛けます。

$$\begin{pmatrix} 1+\rho & 1-\rho \\ 1+\rho & -(1-\rho) \end{pmatrix}\begin{pmatrix} 1 & 1 \\ 1 & -1 \end{pmatrix}=\begin{pmatrix} 2 & 2\rho \\ 2\rho & 2 \end{pmatrix}$$

係数 $\frac{1}{2}$ を行列の4つの要素それぞれに掛けると

$$\begin{pmatrix} 1 & \rho \\ \rho & 1 \end{pmatrix}$$

相関行列は、固有値からなる対角行列と固有ベクトルからなる行列に分解できることがわかりました。


*  *  *


固有(eigen)の由来

固有ベクトル、固有値の固有はドイツ語の eigen に由来します。20世紀のはじめ頃には proper という語も使われていたようですが、より的確な表現として eigen が用いられるようになりました。確かに、相関行列には単位円内を終点とするすべてのベクトルを、45°線に向ける力があります。これが相関行列固有の向き(固有ベクトル)です。そして、右下45°へ向かう力は次第に右上45°へ向かう力に吸い取られ、究極的には右上45°に向かう力に統合されます。これが行列固有の強さ(固有値)です。

eigenは、行列を基底変換しても変わらないことを表しているようです。(志賀浩二『固有値問題30講』数学30講シリーズ10, 朝倉書店pp.40-41)


*  *  *


固有値分解は、どのテキスト、どのウェブサイトを見てもとても難しく書いてあります。おそらく、この記事のように相関行列を例にとるのが最もやさしいと思います。それでも結構大変でしたよね…


*  *  *


「で、これ何?」

というのがほとんどの人の本音ではないでしょうか。そこで、最後に固有値分解の意味についてまとめておきます。

  • 固有ベクトル:行列の働きから向きを取り出したもの
  • 固有値:行列の働きから強さを取り出したもの

行列の働きを傾き(向き)強さ(倍率)二極分解するのが固有値分解です。


もっと知りたい人はこちらへ…
(リンク先の人は私ではありません)

単位円の行き先(相関行列のはたらき)

※私は数学者ではありません。自分用のまとめとしてこれを書いています。楽しむ範囲でご覧いただければ幸いです。内容の正確性については専門家のサイトや動画、専門書等で必ず確認をお願いします。


*  *  *


前回、単位円の円周上を終点とするベクトルに相関行列を掛け、ベクトルの終点の行き先をみました。相関係数の値が0から1へ大きくなるにしたがい45°線に集まり、最大値の1をとるとき、すべてのベクトルの終点は45°線上に乗ることがわかりました。

今回はそのつづきとして、単位円の中に置かれた点それぞれに相関行列で働きかけたとき、ベクトルの終点がどこへ行くのかみます。


*  *  *


まず、単位円内の点を終点とするベクトルについて考えます。下図は、500本の矢印(ベクトル)の終点をカラフルな◯で表しています。

R言語のplot関数を使ったせいか単位円が少しずれてしまっています。申し訳ないです…

500個の◯それぞれは2変数 $V_1$ と $V_2$ の関係を表しています。右上のほうにある◯は $V_1$ と $V_2$ がともに正の値であることを、左上のほうにある◯は $V_1$ が負、 $V_2$ が正であることを表します。左下のほうにある◯は $V_1$ と $V_2$ がともに負であることを、右下のほうにある◯は $V_1$ が正、 $V_2$ が負であることを表します。こうした、変数どうしの関係を示すグラフを散布図といいます。

$V_1$ と $V_2$ の相関係数の値は実測で $-0.0048$、ほぼ0です。確かにこの散布図から、$V_1$ が正の値をとるとき、$V_2$ が正になるのか負になるのか判別しづらい感じです。

散布図には、赤色で単位円の直径が2本描かれています。1つは左下から右上に伸びる45°線、もう1つは左上から右下に伸びる45°線です。


*  *  *


相関係数を0から1へ少しずつ大きくしてみましょう。すると、散布図は次のように形を変えます。

左上:$\rho=0.2$、右上:$\rho=0.4$、左下:$\rho=0.6$、右下:$\rho=0.8$ 



もともと単位円の中に置かれていた500個の◯は、相関係数が高くなるにしたがい、右45°に傾いた楕円状に押しつぶされてゆきます。もう少し解像度を高くして表現すると、相関係数が高くなるにしたがい、左下から右上に向かう楕円の長径は長くなり、左上から右下に向かう楕円の短径は短くなります。500個の◯の行き先は、相関係数によって大きく異なります。

下図は、$\rho=1$ のときの散布図です。500個の◯すべてが、左下から右上に向かう45°の線分にきれいに乗ります。そして、左上から右下へ向かう線分は長さ0となり、消滅します。楕円が線分になり、次元は2から1へ縮約されます。



*  *  *


単位円を終点とするベクトルに相関行列で働きかけると、その終点の分布は単位円(真円)から楕円に変形します。相関係数の値が0から1へ大きくなるにしたがい楕円は押しつぶされ、最大値の1をとるとき45°線に縮約されます。

この不思議な現象をうまく記述する、ぺしゃんこの尺度とも言えるものが固有値と固有ベクトルです。これらについては次の記事で取り上げます。

2025年1月27日

平面がぺしゃんこになるとき(相関行列でみる次元の縮約)

※私は数学者ではありません。自分用のまとめとしてこれを書いています。楽しむ範囲でご覧いただければ幸いです。内容の正確性については専門家のサイトや動画、専門書等で必ず確認をお願いします。


*  *  *


前回、回転行列についてみました。そのときのグラフを再掲します。


 

回転行列で働きかけたベクトルの終点は半径1の真円(単位円)の円周上にあります。美しい回転を実現するのが $R$ でした。ベクトルに働きかける行列のほとんどは、残念ながらベクトルの終点を円周上から外してしまいます。この記事では、相関行列を例にベクトルの終点がどこへ行くのかみます。


*  *  *


2つの変数の関係を表す統計量に相関係数というものがあります。仲のよい犬(🐕と🐩)は、いつも一緒に動きます。こうした関係を「相関が高い」とか「係数係数の値が大きい」と言ったりします。ご主人様が帰宅したとき、犬は大はしゃぎで家中を駆け回ります。それに対して猫は「あ、帰ってきたの? 頭でも撫でてよ」とホームポジションからほとんど動かないことが多いです。こうした犬と猫(🐕と🐈)の関係を「相関が低い」とか「相関係数の値が0に近い」と言ったりします。


*  *  *


相関係数の値は、$-1$から$+1$の間に標準化されています。相関係数の値のイメージはおおよそ次のとおりです。

  • $+1$に近い:2変数が同じ方向に動く
  • $0$に近い:2変数が無関係に動く
  • $-1$に近い:2変数が反対方向に動く


変数の相関を1つの表にまとめたものを相関行列といいます。相関係数を$\rho$とおくと、2変数の相関行列は次のようになります。

$$\begin{pmatrix} 1 & \rho \\ \rho & 1 \end{pmatrix}$$

※ここから数記事にわたり相関行列を例にします。その際、本来観測値である $\rho$ をあたかもパラメーターのように扱います。これは説明の便宜と図形的な面白さからです。ご了承ください。


*  *  *


単位円上の点を終点とするベクトルに、相関行列を働きかけると何が起こるのでしょうか。まず、$x$ 軸の標準基底 $(1, 0)$ に掛けてみましょう。 

$$\begin{pmatrix} 1 & \rho \\ \rho & 1 \end{pmatrix} \begin{pmatrix}  1 \\  0\end{pmatrix}=\begin{pmatrix}  1  \\  \rho \end{pmatrix}$$

この計算結果は、相関係数が0から1へ向かって増加すると、変換後のベクトルの終点が $(1, 0)$ から $(1, 1)$ へ、図のように垂直に上昇することを意味しています。



同様に、$y$ 軸の標準基底 $(0, 1)$ に相関行列を掛けてみましょう。 

$$\begin{pmatrix} 1 & \rho \\ \rho & 1 \end{pmatrix} \begin{pmatrix}  0 \\  1\end{pmatrix}=\begin{pmatrix}  \rho  \\  1 \end{pmatrix}$$

この計算結果は、相関係数が0から1へ増加するにしたがい、変換後のベクトルの終点が $(0, 1)$ から $(1, 1)$ へ、水平に右へ移動することを意味しています。

単位円上の点を終点とする他のいくつかのベクトルにも相関行列を掛けてみました。結果は次の図のようになりました。大変興味深いことに、単位円上の全ての点は、相関係数が高くなるにしたがい、オレンジ点線で示した45°線に集まってきます。相関係数が最大の値である1をとるとき、単位円はぺしゃんこに潰れ、45°線になります。単位円がぺしゃんこになり、線になってしまうことを次元の縮約といいます。


*  *  *


相関行列には、単位円上を終点とするベクトルを45°線に引き寄せる魔力と言いますか磁力と言いますか、そうしたものがあるようです。不思議ですね。

アンケート調査の結果をまとめる統計学の方法に主成分分析というものがあります。仄めかすような書き方で恐縮ですが、相関係数をみれば主成分分析をする意味があるかどうか大体わかります。主成分分析をする意味があるのは、相関係数(の絶対値)がほどよく1に近いときです。


*  *  *


誤解が生じないように、45°線の45°という角度はテクニカルなものであることを付け加えます。散布図を描くときに、傾向線が45°でなければならなないという制約はありません。詳細は今後、分散共分散行列のところで説明します。


矢印を回す不思議な表(回転行列)

※私は数学者ではありません。自分用のまとめとしてこれを書いています。楽しむ範囲でご覧いただければ幸いです。内容の正確性については専門家のサイトや動画、専門書等で必ず確認をお願いします。


*  *  *


前回、連結と伸縮でベクトル(矢印)を表現しました。1つめのベクトルの終点に2つめのベクトルの始点をくっつける作業を和、標準基底の伸縮をスカラー倍とすると、線形代数は和とスカラー倍で世界のすべてを記述しようという大胆な試みになります。壮大なスケールですね。

※行列の掛け算に不案内な人は、動画シリーズ「エクセルで学ぶ はじめての統計」第8回をご覧ください。こちらをクリックすると動画が見られます。


*  *  *


今回は、原点を始点とするベクトル(矢印)を回転させる不思議な表を紹介します。$x$ 軸の標準基底

$$\begin{pmatrix}1 \\  0\end{pmatrix}$$

を例に考えましょう。このベクトルに、不思議な2×2の表 $R$

$$R=\begin{pmatrix} \frac{\sqrt{3}}{2} & -\frac{1}{2} \\ \frac{1}{2} & \frac{\sqrt{3}}{2} \end{pmatrix}$$

を掛けてみます。

$$\begin{pmatrix} \frac{\sqrt{3}}{2} & -\frac{1}{2} \\ \frac{1}{2} & \frac{\sqrt{3}}{2} \end{pmatrix} \begin{pmatrix}  1 \\  0\end{pmatrix}=\begin{pmatrix}  \frac{\sqrt{3}}{2}  \\  \frac{1}{2}\end{pmatrix}$$

右辺の上下の要素は、それぞれ左辺の次のような掛け算の結果です。

$$\frac{\sqrt{3}}{2}\times 1+\left(-\frac{1}{2}\right)\times 0=\frac{\sqrt{3}}{2}$$
$$\frac{1}{2}\times 1+\frac{\sqrt{3}}{2}\times 0=\frac{1}{2}$$

上の式は、2×2の表の上段の2つの数字を順に基底の要素に掛けて足しています。下の式は、2×2の表の下段の2つの数字を順に基底の要素に掛けて足しています。掛けて足していますので、これを積和といいます。


*  *  *

計算の結果得られたベクトル(右辺)の上段の要素 $\frac{\sqrt{3}}{2}$ はcos 30°の値であり、下段の要素 $\frac{1}{2}$ はsin30°の値です。cosは $x$ 軸の座標の回転を表し、sinは $y$ 軸の座標の回転を表しますので、2×2の表 $R$ は $x$ 軸の標準基底を反時計回りに30°回転させる働きを持つことがわかります。それで、表 $R$ を回転行列といいます。私たちがiPadの画面に表示された図形を30°回転させるとき、この行列がiPadの中で働いています。




*  *  *


30°回転させたベクトル

$$\begin{pmatrix}\frac{\sqrt{3}}{2} \\ \frac{1}{2}\end{pmatrix}$$

を、再度30°回転させてみます。

$$\begin{pmatrix} \frac{\sqrt{3}}{2} & -\frac{1}{2} \\ \frac{1}{2} & \frac{\sqrt{3}}{2} \end{pmatrix} \begin{pmatrix}  \frac{\sqrt{3}}{2}  \\  \frac{1}{2}\end{pmatrix}=\begin{pmatrix}  \frac{1}{2}  \\  \frac{\sqrt{3}}{2}\end{pmatrix}$$

回転後のベクトルを表す右辺の上段の要素はcos60°の値($\frac{1}{2}$)に、下段の要素はsin60°の値($\frac{\sqrt{3}}{2}$)になりました。30°の回転を2回ほどこすと $x$ 軸の標準基底は60°回転します。さらに30°回転させると

$$\begin{pmatrix} \frac{\sqrt{3}}{2} & -\frac{1}{2} \\ \frac{1}{2} & \frac{\sqrt{3}}{2} \end{pmatrix} \begin{pmatrix}  \frac{1}{2}  \\  \frac{\sqrt{3}}{2}\end{pmatrix}=\begin{pmatrix}  0  \\  1 \end{pmatrix}$$

回転後のベクトルを表す右辺の上段の要素はcos90°の値(0)、下段の要素はsin90°の値(1)になりました。30°の回転を3回ほどこすと $x$ 軸の標準基底は90°回転します。




*  *  *


$x$ 軸の標準基底に30°の回転を3回ほどこすと $y$ 軸の標準基底にぴったり重なります。回転行列 $R$ をふつうの数に見立てて、3回掛けることを3乗で表記すると、次のようになります。

$$\begin{pmatrix} \frac{\sqrt{3}}{2} & -\frac{1}{2} \\ \frac{1}{2} & \frac{\sqrt{3}}{2} \end{pmatrix} ^3 \begin{pmatrix}  1  \\  0\end{pmatrix}=\begin{pmatrix}  0  \\  1 \end{pmatrix}$$

一般に、回転行列は $\cos\theta$ と $\sin\theta$ を用いて次のように表記されます。

$$\begin{pmatrix} \cos\theta & -\sin\theta \\ \sin\theta & \cos\theta \end{pmatrix}$$

この行列の $n$ 乗は、各要素の角度 $\theta$ を $n$ 倍したものになります。

$$\begin{pmatrix} \cos\theta & -\sin\theta \\ \sin\theta & \cos\theta \end{pmatrix}^n=\begin{pmatrix} \cos n\theta & -\sin n\theta \\ \sin n\theta & \cos n\theta \end{pmatrix}$$

積($n$ 回掛ける)が和($n$ 回足す)になるのは面白いです。実際、回転行列は虚数単位 $i$ を用いて次のように表現できます。左の3つは横軸を実軸、縦軸を虚軸としたときの表現、右の行列は実数平面上の表現です。実数平面の回転行列が複素平面の回転ベクトルに等しいというのは、とても不思議ですね…

$$e^{i n\theta}=\cos n\theta+i\sin n\theta=(\cos\theta+i\sin\theta)^n=\begin{pmatrix} \cos\theta & -\sin\theta \\ \sin\theta & \cos\theta \end{pmatrix}^n$$

(ド・モアブルの定理)


*  *  *


ベクトルを回転させる働きを持つ行列を回転行列といいます。回転行列はiPadにもコンピューターグラフィックスにも応用される重要なツールです。


2025年1月26日

平面で考える線型代数(iPadの操作=線型代数!)

 ※私は数学者ではありません。自分用のまとめとしてこれを書いています。楽しむ範囲でご覧いただければ幸いです。内容の正確性については専門家のサイトや動画、専門書等で必ず確認をお願いします。


*  *  *


前回、線型代数のやさしい例として数直線上の和とスカラー倍をみました。この記事では、小学校(数直線)から中学校(平面)に進みます。

いわゆる「横と縦」のひろがりを持つものを平面といいます。平面に置かれた点の座標は($x$ 軸の値, $y$ 軸の値)という数字のペアで表します。たとえば、下図のオレンジ色の点の座標は $(2, 3)$ です。この点は、原点から右に2だけ進み、中間地点の座標 $(2, 0)$ から上に3だけ進んだところにあります。1つめの矢印の終点を2つめの矢印の始点とするのは前回の数直線の場合と同じです。前回と異なるのは、矢印が横軸(数直線)を上下にはみ出せるところです。




向きと長さを持った矢印をベクトルといいます。ベクトルの和とは、1つめの矢印の終点に2つめの矢印の始点をくっつけて、最終到達点の座標を探る作業です。和は、青色点線の矢印になります。


*  *  *


これを線型代数の記法($f(ax+by)=af(x)+bf(y)$)の右辺で書くと

$$2\begin{pmatrix} 1 \\ 0 \end{pmatrix}+3\begin{pmatrix} 0 \\ 1 \end{pmatrix}=\begin{pmatrix} 2 \\ 3 \end{pmatrix}$$

左辺に数字を縦に2つ並べたかっこが2つあります。これらがベクトルです。左のかっこは、原点から座標 $(1, 0)$ へ向かう矢印を表にしたものです。右のかっこは、原点から座標 $(0, 1)$ へ向かう矢印を表にしたものです。これらのベクトルはともに長さが1であり、座標平面を表現する最も基本的なベクトルであることから、標準基底(ベクトル)といいます。碁盤目状の街を地図に表現するときに不可欠な長さの単位だと考えてください。

1つめの標準基底(右に1だけ進む矢印)には2が掛け合わされています。これは右に標準基底の2倍進むことを意味します。2つめの標準基底(上に1だけ進む矢印)には3が掛け合わされています。これは上に標準基底の3倍進むことを意味します。結果として、座標 $(2, 3)$ に到達します。 



「矢印を引き伸ばす」と言われてもよくわからない、という人もいるかもしれません。しかし、私たちは毎日のように図形の大きさや向きを変える作業をしています。スマホやタブレットの画面を大きくしたり、小さくしたり(ピンチイン・ピンチアウト)していますよね。ここで考えているのはまさにこの操作です。線型代数と聞くと思考停止してしまいますが、iPadの操作を記述したものと考えれば「なんだ、そんなこといつもやっているよ」と気持ちが楽になります。


*  *  *


前回例に挙げた数直線は、上に向かう標準基底がない特殊な場合です。$1+2=3$という足し算であれば、右に向かう標準基底だけを用いて、次のように表記できます。

$$1\begin{pmatrix} 1 \\ 0 \end{pmatrix}+2\begin{pmatrix} 1 \\ 0 \end{pmatrix}=\begin{pmatrix} 3 \\ 0 \end{pmatrix}$$

原点から右に1進んだところに置かれた点の座標は $(1, 0)$ です。この座標からさらに右に2進んだ座標は $(1+2, 0)$、すなわち $(3, 0)$ です。


*  *  *

数直線から面へ、少しずつ概念を拡張していけば、難しさの段差を感じなくて済むのではないでしょうか。さらに深めたい人は3Blue1Brownの動画(内積と双対)をご覧ください。


数直線で考える線型代数

※私は数学者ではありません。自分用のまとめとしてこれを書いています。楽しむ範囲でご覧いただければ幸いです。内容の正確性については専門家のサイトや動画、専門書等で必ず確認をお願いします。


*  *  *


大学の数学に線型代数という分野があります。少しだけ学んだ人は「行列式や逆行列など計算がとても多くて大変な分野」と敬遠しがちです。私もそうでした。


ただ、データサイエンスやAIの時代が到来し、線型代数を避けて通れなくなっています。食わず嫌いを乗り越え、文系でもある程度楽しめる、使えそうな気持ちになることは重要だと思います。そこで、何回かに分けて、文系にとっての線型代数を紹介したいと思います。(専門的、網羅的ではなく、イメージ重視です。)


*  *  *


まず、分野の名称についてですが、線型代数(Linear Algebra)には線型と線形という書き方があるようです。型と形の違いを調べてみると…

  • 型(かた):基準や分類にしたがう様。空手の型、小型車。
  • 形(かたち):見た目、すがた。平行四辺形、美形。

Linear Algebraに対応する表記としては、線型のほうが合うようです。では線型とはどのような型なのでしょうか。次式は、$x$ を $a$ 倍したものと $y$ を $b$ 倍したものの和を入力して得られる関数の値は、$x$ を入力して得られる関数の値を $a$ 倍したものと $y$ を入力して得られる関数の値を $b$ 倍したものの和に等しいことを表しています。

$$f(ax+by)=af(x)+bf(y)$$

料理が得意な人は、「味付けしてから煮るのと煮てから味付けするのが同じはずない」と思いますよね。確かに、上の式が成り立つのは数学の世界でも珍しいです。それで、この特別な型にしたがうものを線型といいます。ただ、こう聞いても私たちは「?」ですよね…


*  *  *


そこで、視覚的にわかりやすいものとして、矢印(→)が用いられます。実は、このブログの初めの記事に矢印が登場していました。


1+2という足し算は、0を起点に長さ1の右へ向かう1つめの矢印に、1を起点に長さ2の右へ向かう2つめの矢印をくっつける作業です。作業の結果、2つめの矢印のやじりは3に到達します。それで、1+2=3となります。(引き算の場合は、2つめの矢印が左に向かいます。)


1×2という掛け算は、0を起点に長さ1の右へ向かう矢印を2倍に引き伸ばす作業です。作業の結果、引き伸ばされた矢印のやじりは2に到達します。それで1×2=2となります。(割り算の場合は、元の矢印縮める作業になります。)


*  *  *


数値例で線形性の理解を深めましょう。右に1進む矢印を $x$、右に4進む矢印を $y$ とおきます。そして、$a=2$, $b=1/2$とおきます。このとき、$f(ax+by)=af(x)+bf(y)$ が成り立つか確かめてみます。簡単化のために $f(z)=z$ とします。

左辺の計算方法

$$f(ax+by)=f(2×1+(1/2)×4)=f(2+2)=4$$

右辺の計算方法

$$af(x)+bf(y)=2×f(1)+1/2×f(4)=2+2=4$$

いずれの計算結果も4、すなわち原点を起点に右に4進む矢印になりました。このように、矢印の伸び縮みと連結の結果をまた矢印で表せることを、和(矢印の連結)とスカラー倍(矢印の伸縮)で閉じているといいます。



*  *  *


「で?」
「こんなの小学生でもわかるよ」

という声が聞こえてきそうです。実は、まさにこれが(私たち文系の範囲での)線型代数です。専門書をみると1ページ目からとてつもなく難しいことが書いてありますが、慣れ親しむ観点からは、この数直線の例を少しだけ膨らませたものが線型代数と考えてしまってよいと思います。むしろ「なんだこんなことか…」の範囲でどんどん便利に使うものが線型代数です。