2024年5月13日

収束、上極限、下極限、ファトゥの補題(Lebesuge Measure)

※私は数学者ではありません。自分用のまとめとしてこれを書いています。楽しむ範囲でご覧いただければ幸いです。内容の正確性については専門家のサイトや動画、あるいは専門書で必ず確認をお願いします。


*  *  *


前回、σ加法族を紹介しました。今回はファトゥの補題を紹介します。これはとてつもなく難しいものですので、大まかなイメージを持てるところまでを目標にします。


収束と極限
数列の先のほうの値が変わらなくなるとき、収束する(converge)といいます。たとえば

$$2+\left(-\frac{1}{2}\right)^j$$

という数列を書き表すと

$$\left\{2+\left(-\frac{1}{2}\right)^1, 2+\left(-\frac{1}{2}\right)^2, 2+\left(-\frac{1}{2}\right)^3, …\right\}$$

この数列は、2を境に上下しながら限りなく2に近づいてゆきます。このとき、この数列は2に収束するといいます。数列には、収束せずに発散する(diverge)ものや振動したまま(oscillate)のものもありますがこの記事では有限な値に収束する数列について考えます。また、数列を集合に見立てた$A_j$はすべての $j$ について可測とします。


上極限と下極限
数列が収束するとき、その数列の一部を抜き出して作成した部分列も収束します。そのようすをみるものを上極限といいます。上の数列を例にしましょう。もとの数列は

$$\left\{2+\left(-\frac{1}{2}\right)^1, 2+\left(-\frac{1}{2}\right)^2, 2+\left(-\frac{1}{2}\right)^3, …\right\}$$

これは2に収束します。この数列から偶数番の要素だけ取り出すと

$$\left\{2+\left(-\frac{1}{2}\right)^2, 2+\left(-\frac{1}{2}\right)^4, 2+\left(-\frac{1}{2}\right)^6, …\right\}$$

これは最小上界(上限)が上から2に向かい収束します。この数列から4の倍数番の要素だけ取り出すと

$$\left\{2+\left(-\frac{1}{2}\right)^4, 2+\left(-\frac{1}{2}\right)^8, 2+\left(-\frac{1}{2}\right)^{12}, …\right\}$$

これも最小上界(上限)が上から2に向かい収束します。このように、もとの数列から作成した部分列の収束先は、もとの数列の収束先と同じことを確かめられます。これは、各部分列の最小上界(上限)を集めてその極限をとる作業ですので、次のように表記できます。

$$a^*=\lim_{j\rightarrow\infty}\sup A_j$$

同様に、減衰曲線の下からの収束をみるときには、各周期の極小値からなる部分列を作り、そのようすをみるのが賢明です。たとえば、奇数番だけ取り出すと

$$\left\{2+\left(-\frac{1}{2}\right)^1, 2+\left(-\frac{1}{2}\right)^3, 2+\left(-\frac{1}{2}\right)^5, …\right\}$$

これは最大下界(下限)が下から2に向かい収束します。各部分列の最大下界(下限)を集めてその極限をとる作業は、次式のように表記できます。$a_*$は下極限です。

$$a_*=\lim_{j\rightarrow\infty}\inf A_j$$

上極限と下極限が存在するとき、次の式が成り立ちます。

$$\lim_{j\rightarrow\infty}\inf A_j\leq\lim_{j\rightarrow\infty}\sup A_j$$

上極限$a^*$と下極限$a_*$が等しいとき、極限が存在するといいます。このとき、上の不等式は等号で成り立ちます。


集合の記法
集合の記法で上極限を表してみましょう。上の例を再び掲げると

$$A_1=\left\{2+\left(-\frac{1}{2}\right)^1, 2+\left(-\frac{1}{2}\right)^2, 2+\left(-\frac{1}{2}\right)^3, …\right\}$$
$$A_2=\left\{2+\left(-\frac{1}{2}\right)^2, 2+\left(-\frac{1}{2}\right)^4, 2+\left(-\frac{1}{2}\right)^6, …\right\}$$
$$A_3=\left\{2+\left(-\frac{1}{2}\right)^4, 2+\left(-\frac{1}{2}\right)^8, 2+\left(-\frac{1}{2}\right)^{12}, …\right\}$$

$A_1$の最小上界は$2+\left(-\frac{1}{2}\right)^2$、$A_2$の最小上界は$2+\left(-\frac{1}{2}\right)^2$、$A_3$の最小上界は$2+\left(-\frac{1}{2}\right)^4$です。これらのうち最小の$2+\left(-\frac{1}{2}\right)^4$は$A_3$の要素ですが、$A_1$の要素でもあり、$A_2$の要素でもあります。すなわち

$$2+\left(-\frac{1}{2}\right)^4\in A_1\cup A_2\cup A_3$$

であり、かつ

$$2+\left(-\frac{1}{2}\right)^4\in A_1\cap A_2\cap A_3$$

また同様に

$$2+\left(-\frac{1}{2}\right)^4\in A_2\cup A_3$$

であり、かつ

$$2+\left(-\frac{1}{2}\right)^4\in A_2\cap A_3$$

さらに

$$2+\left(-\frac{1}{2}\right)^4\in A_3$$

つまり、収束先の候補は、最小上界の候補となる集合をすべて集め、そのいずれにも入っている要素だということになります(簡単化のためにこのようになる部分列を作成しました)。集合の記法では、候補をすべて集めることを$\bigcup$で、いずれにも入っていることを$\bigcap$で表します。よって

$$収束先の候補=2+\left(-\frac{1}{2}\right)^4\in A_3\subset\bigcap_{j=1}^{3}\bigcup_{n=j}^{3}A_n$$

調べる集合の数を増やすにしたがい、収束先の候補が絞り込まれるイメージです。3を3より大きい$J$に一般化すると、候補はさらに絞られます。

$$A_J\subset\bigcap_{j=1}^{J}\bigcup_{n=j}^{J}A_n$$

測度の単調性から

$$\mu(A_J)\leq\mu\left(\bigcap_{j=1}^{J}\bigcup_{n=j}^{J}A_n\right)$$

$J$を限りなく大きくすると(記述の煩雑さを避けるために$J$を $j$ に置き換えています)

$$\lim_{j\rightarrow\infty}\sup\mu(A_j)\leq\mu\left(\bigcap_{j=1}^{\infty}\bigcup_{n=j}^{\infty}A_n\right)$$

下極限は、上極限と対称をなしますので(と簡単に書くとお叱りを受けますが…)

$$\mu\left(\bigcup_{j=1}^{\infty}\bigcap_{n=j}^{\infty}A_n\right)\leq\lim_{j\rightarrow\infty}\inf\mu(A_j)$$

※集合の記法はとても難しいです。こちらを参照しました。
こちらは英語ですが、とてつもなくhelpfulです。


ファトゥの補題
ここまでの結果をまとめると、数列の上極限と下極限を集合の上極限と下極限ではさみこむことができます。すなわち、$\mu(\bigcup_{j=1}^{\infty}A_j)$が有限であるとき、次の不等式が成り立ちます。

$$\mu\left(\bigcup_{j=1}^{\infty}\bigcap_{n=j}^{\infty}A_n\right)\leq\lim_{j\rightarrow\infty}\inf\mu(A_j)$$
$$\leq\lim_{j\rightarrow\infty}\sup\mu(A_j)\leq\mu\left(\bigcap_{j=1}^{\infty}\bigcup_{n=j}^{\infty}A_n\right)$$

これを極限の記法で書くと

$$\mu(\lim_{j\rightarrow\infty}\inf A_j)\leq\lim_{j\rightarrow\infty}\inf\mu(A_j)$$
$$\qquad\qquad\leq\lim_{j\rightarrow\infty}\sup\mu(A_j)\leq\mu(\lim_{j\rightarrow\infty}\sup A_j)$$

この結果をファトゥの補題(Fatou's lemma)といいます。「ファトゥの補題はルベーグ積分に関するもので、集合に関するものではない」と言われるかもしれません。この後少しずつ学ぶと見えてくると思いますが、ルベーグ=カラテオドリの測度はそのままルベーグ積分です。積分の記法で書くと(証明は『数の落とし子』の方がされています。今の私にはとても追いきれませんでした。こちらもあわせて参照しました。)

$$\int\lim_{j\rightarrow\infty}\inf f_j d\mu\leq\lim_{j\rightarrow\infty}\inf\int f_j d\mu$$
$$\qquad\qquad\leq\lim_{j\rightarrow\infty}\sup\int f_j d\mu\leq\int\lim_{j\rightarrow\infty}\sup f_j d\mu$$

積分は測度の一形態であるとは、ルベーグの慧眼です。


2024年5月8日

σ加法族(Lebesgue Measure)

※私は数学者ではありません。自分用のまとめとしてこれを書いています。楽しむ範囲でご覧いただければ幸いです。内容の正確性については専門家のサイトや動画、あるいは専門書で必ず確認をお願いします。


*  *  *


前回は集合族の測度についてみました。今回は、σ加法族について紹介します。

本格的に確率を学びたいと思って専門書を開くと、たいがい1ページ目にσ加法族が登場します。私たちの大半は、この用語を見た瞬間に頭が真っ白になり、開いたばかりの本を閉じ、図書館の書棚にそっと返してしまいます。この段階をなんとか超えたいな、と思います。


べき集合
集合$A$の要素からなるすべての部分集合の集まりをべき集合(power set) といい、$2^A$と表記します。2の$A$乗と書くのは、$A$の要素の数が$A$個あるとき、べき集合の要素の数は$2^A$個存在するためです。

コイントスの結果、表が出ることを1、裏が出ることを2としましょう。これは、2つの要素からなる集合として表記できます。

 $$A=\{1, 2\}$$

$A$のべき集合は

$$2^A=\{\varnothing, 1, 2, \{1, 2\} \}$$

確かに要素の数は$2^A=2^2=4$個あります。集合の要素の数が3なら8、4なら16の要素がべき集合にあります。


σ加法族
準備が整いましたので、σ加法族を定義します。集合$X$のべき集合 $2^X$を$\mathcal{F}$とおき、$A$を$\mathcal{F}$の任意の要素とします。このとき、次の条件を満たす$\mathcal{F}$をσ加法族(σ-field, σ-algebra)といいます。

  1. $\varnothing\in\mathcal{F}$
  2. $A\in\mathcal{F} \implies A^c\in\mathcal{F}$
  3. $\{\boldsymbol{A}_j\}\subset\mathcal{F} \implies \bigcup_{j=1}^{\infty}A_j\in\mathcal{F}$

1つめは、空集合が$\mathcal{F}$の要素であるということです。上のコイントスの例でも、べき集合の要素に空集合がきちんと入っています。

2つめは、これが$\mathcal{F}$の要素ならこれ以外も$\mathcal{F}$の要素だということです。コイントスの例では「表が出る:1」と「裏が出る:2」はともに$\mathcal{F}$の要素です。同様に「表か裏が出る: $\{1, 2\}$」と表も裏も出ない、すなわち「空集合:$\varnothing$」はともに$\mathcal{F}$の要素です。

3つめは、可算無限の集合列の要素すべてが$\mathcal{F}$の要素なら、その和集合も$\mathcal{F}$の要素だということです。コイントスの例は有限集合ですが、気持ちだけ眺めると…

$$\{\varnothing, 1, 2, \{1, 2\} \}$$

のすべての要素の和集合は$ \{1, 2\}$です。これは明らかに$\mathcal{F}$の要素です。

条件2と条件3を用いれば、$\bigcap_{j=1}^{\infty}A_j$も$\mathcal{F}$の要素だと確かめられます。条件2から、$A\in\mathcal{F}$なら$A^c\in\mathcal{F}$です。条件3から、その和集合も$\mathcal{F}$の要素です。すなわち

$$\{\boldsymbol{A}_j^c\}\subset\mathcal{F} \implies \bigcup_{j=1}^{\infty}A_j^c\in\mathcal{F}$$

再び条件2から

$$\left(\bigcup_{j=1}^{\infty}A_j^c\right)^c=\bigcap_{j=1}^{\infty}A_j\in\mathcal{F}$$

σ加法族は、測る場としてよい性質を持っています。コイントスの例では、表が出る確率、裏が出る確率、表か裏が出る確率、表も裏も出ない確率、起こりうる事象すべてを確率の計測対象にできます。確率を測る場として心地よいです。

確率などを測れる場という意味で、集合$F$から生成されたσ加法族$\mathcal{F}$を可測空間(measurable space)といい、$(F, \mathcal{F})$と表記します。確率論の専門書によく$(\Omega, \mathcal{F}, P)$と書いてありますが、これは可測空間を確率測度$P$で測ること意味しています。


*  *  *


σ加法族の生成
もとの集合$F$からσ加法族を作成することもできます。集合$F$から最小のσ加法族を作成する作業を生成(generate)といいます。集合$F$から生成されたσ加法族を$\sigma(F)$と表記します。

上で用いたコイントスの例を少しだけ拡張してみましょう。コインを2回投げた結果は次の4とおりです。

$4=\{表, 表\}$
$3=\{表, 裏\}$
$2=\{裏, 表\}$
$1=\{裏, 裏\}$

それぞれに4から1までの番号をつけました。これらを集めた集合$F$は次のようになります。

$$F=\{1, 2, 3, 4\}$$

この集合から生成されるσ加法族$\sigma(\{1, 2\})$は

$$\sigma(\{1, 2\})=\{\varnothing, F, \{1, 2\}, \{3, 4\}\}$$

となります。これがσ加法族であることを確かめましょう。この記事のはじめに書いた3条件のうちの1つめは、空集合がσ加法族の要素であるということです。空集合は確かに$\sigma(\{1, 2\})$の要素です。

3条件のうちの2つめは、補集合がσ加法族の要素であるということです。ここまでで$\sigma(\{1, 2\})$の要素になっているのは$\{\{1, 2\}, \varnothing\}$です。これらの補集合はそれぞれ

$$\{1, 2\}^c \implies \{3, 4\}$$
$$\varnothing^c \implies F$$

確かにこれらも$\sigma(\{1, 2\})$の要素です。3条件のうちの3つめは、生成されたσ加法族のすべての要素の和集合が$\sigma(\{1, 2\})$の要素であるということです。

$$F=\varnothing\cup F\cup\{1, 2\}\cup\{3, 4\}$$

は明らかです。よって、3条件すべてを満たす$\sigma(\{1, 2\})$は集合$E$から生成されたσ加法族だといえます。



*  *  *


とりかかりは、これくらいでいいかなと思います。

見通しを立てたい人は、こちらへ。


ルベーグ測度の世界では零集合が決定的な役割を果たすように思います(志賀浩二『ルベーグ積分30講』pp.52-53)。おおげさかもしれませんが、虚数単位 $i$ と同じくらいの役割を果たしていそうです。そのうちだんだんみえてくるでしよう…


可測集合族の測度(Lebesgue Measure)

※私は数学者ではありません。自分用のまとめとしてこれを書いています。楽しむ範囲でご覧いただければ幸いです。内容の正確性については専門家のサイトや動画、あるいは専門書で必ず確認をお願いします。


*  *  *


前回は様々な集合の可測性を調べました。今回はそのつづきです。集合の重なりがないときの測度、集合がずらりと並ぶ集合族と集合列の測度についてみます。


素集合
素(disjoint)とは、重なっていないということです。たとえば、神奈川県と秋田県は地図上で重なっていません。「この番地は神奈川県であり、秋田県でもあります」というところはないはずです。集合$A$と$B$の両方に入る要素が1つもないことを互いに素といい、そのような集合を素集合(disjoint sets)といいます。式で書くと

$$A\cap B=\varnothing$$

$A$と$B$が可測であるとき、素集合の測度は$A$の測度と$B$の測度の和と等しくなります。

$$\mu(A\cup B)=\mu(A)+\mu(B)$$

神奈川県と秋田県を合わせた面積は、神奈川県の面積と秋田県の面積の和に等しいという、私たちの感覚に合う結論が測度の世界でも得られます。


集合族
つづいて、集合を有限個並べ集合にしたもの$\{A_1, A_2, A_3, …, A_J\}$について考えます。こうしたものを集合族(familiy of sets)といいます。すべての要素が可測集合である集合族の和集合と積集合は、ともに可測です。すなわち

$$\bigcap_{j=1}^JA_j    \bigcup_{j=1}^JA_j$$

はともに可測です。すべての$j\neq k$について$A_j\cap A_k=\varnothing$であれば、和集合の測度は完全加法性を満たします。すなわち

$$\mu\left(\bigcup_{j=1}^JA_j\right)=\sum_{j=1}^J\mu(A_j)$$

47都道府県からなる日本国の面積は各都道府県の面積の和であるというこの結論は、私たちの感覚に合います。数学は難しいものではありますが、奇を衒った突拍子もないものではありません。大半は極めて常識的なものです。


集合列
さらに、集合を可算無限個並べた集合$\{A_1, A_2, A_3, …\}$に拡張しましょう。こうしたものを集合列(sequence of sets)といいます。すべての$j\neq k$について$A_j\cap A_k=\varnothing$であれば、可測な集合列の和の測度も完全加法性を満たします。すなわち

$$\mu\left(\bigcup_{j=1}^{\infty}A_j\right)=\sum_{j=1}^{\infty}\mu(A_j)$$

集合列の要素がどんどん大きくなるとき、すなわち、すべての $j$ について $A_j\subset A_{j+1}$であるとき、単調増加な集合列といいます。この測度は最後の、つまり最大の要素の測度に収束します。

$$\mu\left(\bigcup_{j=1}^{\infty}A_j\right)=\lim_{j\rightarrow\infty}\mu(A_j)$$

ある人の居住地を最も小さな単位で表すと、「5階1号室に住んでいます」などとなります。1段階大きなくくりでは「〇〇マンションに住んでいます」、くくりを少しずつ大きくしてゆくと「△△市に住んでいます」「××県に住んでいます」「日本国に住んでいます」「地球に住んでいます」…となります。最後の一番大きなくくりにそれまでのくくりすべてが含まれています。単調増加とはこういう状況です。

単調増加な集合列と対をなすのが単調減少な集合列です。これは、要素がどんどん小さくなる、つまりすべての $j$ について$A_{j+1}\subset A_j$であるような集合列です。この測度は最後の、つまり最小の要素の測度に収束します。

$$\mu\left(\bigcap_{j=1}^{\infty}A_j\right)=\lim_{j\rightarrow\infty}\mu(A_j)$$

ただし、$\mu(A_1)$は有限とします(最小の要素の測度になるのだから、この条件は不要にみえますが、証明の過程で必要となります)。この式は上式とよく似ていますが、上式は和$\bigcup$、この式は積$\bigcap$であることに注意しましょう。

玉ねぎ🧅を横で輪切りにすると同心円状にリングが重なっていますよね。リングを外側から1枚ずつ取り除いてゆくと、最後に一番小さな真ん中だけが残ります。単調減少とはそんなイメージです。


2024年5月7日

空集合、全体集合、零集合、補集合、和集合、積集合の可測性(Lebesgue Measure)

※私は数学者ではありません。自分用のまとめとしてこれを書いています。楽しむ範囲でご覧いただければ幸いです。内容の正確性については専門家のサイトや動画、あるいは専門書で必ず確認をお願いします。


*  *  *


前回の記事で測度を定義しました。今回はそのつづきです。集合$X$の様々な部分集合と要素の可測性を調べます。


空集合と全体集合
空集合$\varnothing$と全体集合$X$は可測です。これは、可測性の定義式にこれらを代入してすぐ確かめられます。

$$\mu(E\cap \varnothing)+\mu(E-\varnothing)=\mu(\varnothing)+\mu(E)=\mu(E)$$
$$\mu(E\cap X)+\mu(E-X)=\mu(E)+\mu(\varnothing)=\mu(E)$$


零集合
最小の測度を持つ要素、もしくはその集まりを零集合(null set)といいます。零集合の可測性を調べてみましょう。

$$\mu(E\cap A)+\mu(E-A)\leq\mu(A)+\mu(E)=\mu(E)$$

第1項は最小の測度を持つ零集合と任意の集合の積が零集合であることから、第2項は集合から集合を引いた結果がもとの集合以下であることから、このように変形できます。最右の等式は$\mu(A)=0$(最小の測度は0というのが測度の基本性質)であることから得られます。上式の最左と最右に注目すると

$$\mu(E\cap A)+\mu(E-A)\leq\mu(E)$$

これは、前回紹介した可測性の弱い条件ですので、可測性が確認できました。空集合も零集合ですので可測です。


補集合
集合$X$の部分集合$A$に対して、$A$ではないものを補集合といい、$A^c$と表記します。いわゆる、ではないほうが補集合です。$A$が可測であるとき、$A^c$の可測性を調べましょう。

$$\mu(E\cap A^c)+\mu(E-A^c)=\mu(E-A)+\mu(E\cap A)$$

第1項は「ではないほうと重なる」と「であるほうを除く」が同じであることから、第2項は「ではないほうを除く」と「であるほうと重なる」が同じであることから、このように変形できます。右辺の第1項と第2項を入れ替えると

$$\mu(E\cap A)+\mu(E-A)$$

これはとりもなおさず可測性の定義式です。

$$\mu(E)=\mu(E\cap A)+\mu(E-A)$$

右辺の各項を補集合の表記に戻せば、補集合の可測性が確認できます。

$$\mu(E)=\mu(E\cap A^c)+\mu(E-A^c)$$


和集合と積集合
集合$X$の部分集合$A, B$の和集合とは、集合$A$または$B$に入る要素すべての集まりであり、$A\cup B$と表記します。積集合とは、集合$A$と$B$の両方に入る要素すべての集まりであり、$A\cap B$と表記します。和集合はまたは、積集合はかつですので

$$A\cap B\subset A\cup B$$

となります。可測である集合$A$と$B$の和集合の可測性を調べましょう。可測性の定義式は

$$\mu(E)=\mu(E\cap A)+\mu(E-A)$$

$B$が可測であることを用いて$\mu(E-A)$を測ると

$$\mu(E-A)=\mu((E-A)\cap B)+\mu((E-A)-B)$$

これを上式の右辺第2項に代入すると

$$\mu(E)=\mu(E\cap A)+\mu((E-A)\cap B)+\mu((E-A)-B)$$

右辺第3項の形を少し変えると、項の中に和集合が現れます。

$$\mu(E)=\mu(E\cap A)+\mu((E-A)\cap B)+\mu(E-(A\cup B))$$

この式を式(*)とおきましょう。右辺の第1項と第2項は、和集合の可測性の定義式の第1項 $\mu(E\cap (A\cup B))$と何らか比べられるべきです。少しトリッキーですが、この集合を次のように変形します。

$$E\cap (A\cup B)=(E\cap A)\cup(E\cap B)$$
$$\qquad\qquad\qquad\qquad=(E\cap A)\cup((E-A)\cap B)$$

劣加法性から

$$\mu(E\cap (A\cup B))=\mu((E\cap A)\cup((E-A)\cap B))$$
$$\qquad\qquad\qquad\quad\leq\mu(E\cap A)+\mu((E-A)\cap B)$$

これは、この式の最左辺が、式(*)の右辺第1項と第2項の和より小さいことを意味します。式(*)の右辺第1項と第2項が最右辺であれば等式が成立しますから、それより小さい左辺を代入すれば、関係は$\geq$になります。すなわち

$$\mu(E)\geq\mu(E\cap(A\cup B))+\mu(E-(A\cup B))$$

この式は、可測集合$A, B$の和集合が可測であることの定義式です。

さいごに、可測集合$A, B$の積集合の可測性を調べましょう。補集合と和集合はすでに可測であることが確かめられていますので、次のような変形から可測であることが示されます。

$$(A^c\cup B^c)^c=A\cap B$$

私たちがよくみかける集合について、可測性が確認できました。


ジョルダン、ルベーグ、カラテオドリ(Lebesgue Measure)

※私は数学者ではありません。自分用のまとめとしてこれを書いています。楽しむ範囲でご覧いただければ幸いです。内容の正確性については専門家のサイトや動画、あるいは専門書で必ず確認をお願いします。


*  *  *


前回までで、距離空間のシリーズをひとまず終えました。次のテーマとして測度とベクトル空間を候補にしたのですが、まずは測るということの理解を深めたいと思い、ルベーグ測度のシリーズにしました。


  • ルベーグ測度:測る
  • ベクトル空間:計算する


*  *  *


私たちは、日常生活の中でいろいろなものを測っています。距離を測ったり、面積や体積を測ったり、重さを測ったり、個数を測ったり、気温を測ったり、高度を測ったり、濃度を測ったり、照度を測ったり、彩度を測ったり、比率を測ったり、確率を測ったりします。こうしたことができるのは、測りかたのルールがきちんと定まっているためです。

フランス人のルベーグ(Henri Léon Lebesgue:1875-1941)という人は、測りかたを深く探究した数学者です。1789年大革命でメートル法を提唱したフランスの伝統は、この人の理論に息づいているのでしょう。

こちらの記事によれば、メートル法以前には800とおりもの測りかたがあったようです…


*  *  *


内測度と外測度
入り組んだ形をした敷地の面積を近似することを考えます。

まず、敷地の境界にかからないように有限個のタイルを敷地内側に敷き詰め、そのタイルの面積の総和で敷地面積を近似する方法があります。これを内測度(inner measure)といいます。もうひとつ、敷地の境界にほんのわずかだけかかるように有限個のタイルを敷き詰め、そのタイルの面積の総和で敷地の面積を近似する方法があります。これを外測度(exterior measure, outer measure)といいます。

内測度の上限外測度の下限が等しいことを可測(measurable)といいます。


ジョルダンの測度
敷き詰めるタイルが大きいとき、内測度は外測度より小さくなります。1m四方のタイルは、曲線を描く敷地にピッタリ敷き詰められず、隙間ができます。これを敷地境界にかかるように敷き詰めると、大きくはみ出します。

敷地へのフィット感を高めるために、タイルを50cm四方、10cm四方、5cm四方、1cm四方、…とどんどん小さくしてみましょう。とてつもなく変な形をした敷地でない限り、あるところで内測度の上限と外測度の下限が一致します。この可測な敷地の面積をジョルダン測度(Jordan measure)といいます。


ルベーグの測度
ジョルダンは、敷地に有限個のタイルを敷き詰めることを考えました。この考えを拡張して、敷地に可算無限個のタイルを敷き詰めることを考えたのがルベーグです。

敷き詰めるタイルの枚数を可算無限個へ拡張すると、ジョルダン不可測な敷地の面積も測れるようになります。ここでは、1m四方の正方形から、縦横ともに有理数の値をもつ可算無限個の点(有理点)をすべて除いた図形を例にします(志賀浩二『ルベーグ積分30講』p.41, 図13)。極小・無数の穴が空いた1m四方のメッシュのイメージです。

ジョルダンの方法にはタイルが有限個しかありませんので、可算無限個の穴すべてをカバーできません。ルベーグの方法にはタイルが可算無限個用意されていますので、穴すべてをカバーできます。極小のタイルでカバーした穴それぞれの面積を0とみると、それを可算無限個足し合わせた面積も0になります。すると、このとてつもなく変な形をした敷地の面積は1平方メートルと0の差、1平方メートルとなります。

$$外側から測った正方形の面積-可算無限個の穴の面積総計$$
$$=1-0=1$$


*  *  *


ルベーグの考えをまとめましょう。 $j(.), m_*(.), m^*(.)$をそれぞれ、ジョルダン測度、ルベーグ内測度、ルベーグ外測度とします。このとき集合$A$のルベーグ内測度$m_*(A)$は、ジョルダン可測な大枠$E$と、$E$から$A$を除いた部分($E-A$の外測度)の差となります。すなわち

$$m_*(A)=j(E)-m^*(E-A)$$

集合$A$の中心部からきわへ向かって外測度の上限をとり、$A$の外側を塗りつぶすと$A$が浮かび上がるイメージです。ルベーグ可測であるとき、内測度と外測度は等しくなります。よって

$$m^*(A)=j(E)-m^*(E-A)$$


*  *  *


カラテオドリの可測
上式の右辺にある$m^*(E-A)$を移項して、左右入れ替えると

$$j(E)=m^*(A)+m^*(E-A)$$

$A$が可測であるとき$j(E)=m^*(E)$であり、また$A$が$E$の部分集合であることに注目すると$m^*(A)=m^*(E\cap A)$が成り立ちます。これらを代入すると

$$m^*(E)=m^*(E\cap A)+m^*(E-A)$$

ルベーグの外測度$m^*(.)$を$\mu(.)$に置き換えると

$$\mu(E)=\mu(E\cap A)+\mu(E-A)$$

すべての$E$についてこの式が成り立つとき、$A$は可測であるといいます。このように表現するのは、もともと$A$の可測性を示す式を変形して得られた式であるためです。上式は次のようにも書けます。$A^c$の可測性については次回説明します。

$$\mu(E)=\mu(E\cap A)+\mu(E\cap A^c)$$

この式は、$A$に含まれるものと含まれないものに$E$を二分して測った測度の和が、$E$の測度に等しいことを示しています。距離空間でもデデキントの定理、ベールのカテゴリー定理、可分性など全体を二分する話が出てきました。数学では「これとこれ以外」という分けかたが認識の基礎になっているようです。この可測の条件は、ルベーグと同じ世代のギリシャ人数学者、カラテオドリ(Constantin Carathéodory)が提示しました。それで、カラテオドリの条件といいます。


*  *  *


カラテオドリ測度の性質
カラテオドリの外測度(exterior measure, outer measure)には次のような性質があります。

  1. $0\leq\mu(A)\leq\infty$
  2. $\mu(\varnothing)=0$
  3. $A\subset E \implies \mu(A)\leq\mu(E)$
  4. $A\subset\bigcup_{j=1}^{\infty}A_j \implies \mu(A)\leq\sum_{j=1}^{\infty}A_j$ 

記号ばかりですので説明を加えます。まず1ですが、測度はマイナスの値をとりませんが、無限大まで大きな値はとりうるということです。

つづいて2ですが、これは空集合$\varnothing$を測った値を0とするということです。空集合とは、何も載っていないお皿🍽️のイメージです。お皿に何か載っている🍛のであれば、カロリーを測ったり、重さを測ったり、大きさを測ったりできますが、何も載っていなければ測りようがありません。そうしたものの値は0にするということです。条件1で測度の下限を0にしましたが、これは空集合の測度を0と定義することによります。

3は単調性(monotonicity)といわれる性質です。より大きなものにより大きな値を与えるという測度の性質です。たとえば、東京都より日本国のほうが大きいので、東京都の面積より日本国の面積のほうが広いと評価するということです。もし「東京都の面積より日本国の面積のほうが狭いです」と言われると、私たちは「えっ?」となってしまいます。「他も含めた敷地の面積はもとの敷地の面積より広くなる」という、私たちの常識的な感覚と合う測度の性質が単調性です。

4は劣加法性(subadditivity)といわれる特徴です。外測度を測るとき、敷き詰めるタイルが重なっていても構いません。また、境界にかかるようにタイルを敷き詰めます。それで、敷き詰めたタイルそれぞれの面積の合計は敷地面積以上になります。距離空間には三角不等式がありました。これは、ゴールに真っ直ぐ突き進むより、どこかに立ち寄ったほうが距離は長くなるという性質です。この特徴を、より一般的な測度の世界でも保つということです。

条件4を用いると、可測の条件を弱く表現できます。

$$\mu(E)\geq\mu(E\cap A)+\mu(E\cap A^c)$$

なぜかというと、逆向きの不等式($\leq$)は条件4そのものだからです。


*  *  *


一般的理論に還元されてしまうと、数学は内容のない単なる美しい形式になってしまう。そしてそれはすぐに死にたえてしまう

(ルベーグの言葉を引用したメルツバッハ=ボイヤー『数学の歴史』からの引用を引用した志賀浩二『ルベーグ積分30講』数学30講シリーズ, 9, 朝倉書店, 1991, p.38)


2024年5月5日

距離空間の可分性(Metric Space)

※私は数学者ではありません。自分用のまとめとしてこれを書いています。楽しむ範囲でご覧いただければ幸いです。内容の正確性については専門家のサイトや動画、あるいは専門書で必ず確認をお願いします。


*  *  *


距離空間$(X, d)$において、可算・稠密な部分集合があることを可分(separable)といいます。たとえば、実数には可算・稠密な有理数という部分集合がありますので、可分です(ベールのカテゴリー定理)。言い換えると、下式のように、部分集合の閉包(部分集合とその導集合の和)が全体集合になっているとき、可分といいます。

$$\mathbb{R}=\overline{\mathbb{Q}}=\mathbb{Q}\cup\mathbb{Q}^d$$


p-ユークリッド空間
$N$次元の実数$\mathbb{R}$の距離空間$(\mathbb{R}^N, d)$の可分性について考えます。ここで距離の測りかた$d_p$を次のように定義します。

$$d_p=\left(\sum_{n=1}^N|x_n-y_n|^p\right)^{1/p}$$

ここで、$p$は1以上の有限な実数です。$p$の値が無限大であるときには、各要素どうしの距離のうち最長のものを距離とします。

$$d_{\infty}=\left(\sum_{n=1}^N|x_n-y_n|^{\infty}\right)^{1/{\infty}}=\max_{1\leq n\leq N}|x_n-y_n|$$

$d_{\infty}$が$\max$関数になるのは、絶対値で測った最長の距離を無限大乗した値は、他の小さな値の無限大乗を圧倒(dominate)するためです。最長の距離以外のものは視界から消えるということです。

これらの距離空間はいずれも可分です。なぜかというと、実数は有理数 $\mathbb{Q}$と無理数(有理数の集積点、つまり有理数$\mathbb{Q}$の導集合の要素)の和集合だからです。任意の実数$x$について

$$x\in\mathbb{Q}\cup\mathbb{Q}^d$$

右辺は閉包に等しいので

$$\mathbb{R}=\overline{\mathbb{Q}}$$

これは可分の定義そのものです。


$l^p$空間
数列(sequence of numbers)とは、数を並べたものです。似たものに点列がありますが、点列は空間に置かれた点の集まりです。1次元の点列が数列です。

次の条件を満たす実数からなる数列$\{\boldsymbol{x}_j\}_{j=1}^{\infty}$を$l^p$空間といいます。

$$\sum_{j=1}^{\infty}|x_j|^p<\infty$$

この空間での距離の測りかた $d$ を次のように定義します。

$$d_p(\{\boldsymbol{x}_j\}_{j=1}^{\infty}, \{\boldsymbol{y}_j\}_{j=1}^{\infty})=\left(\sum_{j=1}^{\infty}|x_j-y_j|^p\right)^{1/p}$$

この数列空間も、上と同様の議論から可分です。


$l^{\infty}$空間
$l^p$空間の$p$を無限大にしたものを$l^{\infty}$空間といいます。この空間での距離の測りかた $d$ を次のように定義します。

$$d_{\infty}(\{\boldsymbol{x}_j\}_{j=1}^{\infty}, \{\boldsymbol{y}_j\}_{j=1}^{\infty})=\sup_{j\in\mathbb{N}}|x_j-y_j|$$

$l^{\infty}$空間内の集合$E$は可算ではなく、稠密でもありません。したがって $l^{\infty}$空間は可分ではありません。この証明のラフ・スケッチは次のとおりです(現時点の私の理解の範囲内です)。


*  *  *


実数直線上の閉区間$[0, 1]$を例にとります。この区間内の数は複数の2進数展開で表すことができます。たとえば、0.5は

$$0.5=\frac{1}{2}+\sum_{j=2}^{\infty}\frac{0}{2^j}$$


$$0.5=\frac{0}{2}+\sum_{j=2}^{\infty}\frac{1}{2^j}$$

このことは、閉区間$[0, 1]$内の数を表す2進数展開の分子を数列に見立てたものの濃度は、閉区間$[0, 1]$の濃度以上であることを意味します。つまり

$$\aleph\leq|2進数展開の分子を数列に見立てたもの|$$

この不等式は、可分性の条件の1つである可算と矛盾します。

もう1つの条件は稠密ですが、これは集積点がとれるかどうかで判定します。閉区間$[0, 1]$から互いにごく近い2点$x, y$を取り出し、2進数展開します。$x$と$y$の値が異なるということは、2進数展開のいずれかの項の値が異なるということです。たとえば、第 $j$ 項の値だけが次のように異なるとしましょう。

$$xの第 j 項:\frac{1}{2^j}  yの第 j 項:\frac{0}{2^j}$$

ここで分子だけ取り出すと1と0になります。したがって、$x, y$の距離を $l^{\infty}$で測ると、絶対値ですから1になります。この1は孤立点となり、集積点になりえません。これは、$x, y$を表す2進数展開の数列の$l^{\infty}$距離が稠密でないことを意味します。

可分の条件である可算も稠密も満たさないことから、数列空間$l^{\infty}$は可分ではないことがわかりました。


*  *  *

証明の詳細はとても難しいです。また理解が進んだら戻ってきて、よりよい形になるよう加筆・修正したいと思います。


2024年5月4日

集合の直径、集合と集合の距離、集合と点の距離(Metric Space)

※私は数学者ではありません。自分用のまとめとしてこれを書いています。楽しむ範囲でご覧いただければ幸いです。内容の正確性については専門家のサイトや動画、あるいは専門書で必ず確認をお願いします。


*  *  *


2点間の距離を応用すれば、点と集合の距離や集合と集合の距離も測れそうです。また、集合の幅のようなもの(集合の直径)も測れそうです。今回は、これらの測りかたを紹介します。以下はすべて距離空間 $(X, d)$についての話であり、$x$は$X$の要素、$A, B, E$は$X$の非空な部分集合とします。


点と集合の距離
まず、点と集合(要素の集まり)の距離を考えましょう。直感的には、点と集合内の各要素の距離のうち、最も短いものが点と集合の距離になりそうです。日常会話で「コンビニまでの距離」と言うとき、最寄りのコンビニまでの距離ですよね。距離空間では、この直感どおりに点と集合の距離を定義します。点$x^*$と集合$E$の距離は

$$d(x^*, E)=\inf\{d(x^*, x)|x\in E\}$$

$\inf$は下限です。高校のとき、点と線の距離という単元がありました。あのとき、点から線に向かって垂線(直角に交わる線)を引いたのは、点から線という集合への最短距離を測るためでした。

$x^*$が集合$E$の内点または境界点であるとき、点と集合の距離は0です。


集合と集合の距離
つづいて、集合と集合の距離を測りましょう。距離空間では、集合$A$と集合$B$の距離を次のように測ります。

$$d(A , B)=\inf\{d(a, b)|a\in A, b\in B\}$$

これも、最寄りの距離です。コンビニとドラッグストアの距離というとき、コンビニの隣にドラックストアが立地していれば、その距離を測りましょうということです。これも直感に合います。わざわざ目の前のコンビニと隣町のドラッグストアの距離を測らないですよね。

集合$A$と$B$に共通部分があるとき($A\cap B\neq\varnothing$)、2つの集合の距離は0とします。商業施設の中にコンビニとドラッグストアが併設されているとき、どちらも商業施設内にあるという意味では、距離が0だと言えます。


集合の直径
集合の直径についても考えることができます。$X$の有界な部分集合$E$の直径(diameter)を、その要素$x_1, x_2$で表すと

$$diam(E)=\sup\{d(x_1, x_2)|x_1, x_2\in E\}$$

$\sup$は上限です。集合が楕円のような形をしているとき、長径(長い方の「直径」)を集合の直径とする、というイメージです。

$E$が1点集合(要素が1つだけ)であるとき、直径は0です。

ここまでの知識を用いると、集合と集合の距離、そして集合の直径の関係を表すことができます。2つの集合$A$と$B$について

$$diam(A\cup B)\leq diam(A)+diam(B)+d(A, B)$$

上でも書きましたが、$A$と$B$に共通部分があるとき$d(A, B)=0$になります。$A$と$B$に共通部分がないときには$d(A, B)>0$になります。


距離の写像の連続性
ここまで、点は動かないと仮定していました。点が連続に動くとき、点 $x$ と集合$E$の距離を次のような連続写像とみなすことができます。

$$f:X\rightarrow \mathbb{R}^+$$

ここで用いる連続の概念はリプシッツ連続です。すなわち、写像 $f$ は次の条件を満たします。

$$d(f(x_1), f(x_2))\leq K\cdot d(x_1, x_2)$$

この不等式が成り立つことを示しましょう。すべての$x\in E$について、点と集合の距離の定義から、次の不等式が成り立ちます。

$$d(x_1, E)\leq d(x_1, x)$$

これは、点$x_1$と集合$E$の距離は、2点$x_1$と$x$の距離のうち最短のものであるという、点と集合の距離の定義からわかります。つづいて、右辺に三角不等式を適用すると

$$d(x_1, E)\leq d(x_1, x)\leq d(x_1, x_2)+d(x_2, x)$$

真ん中の式を除いて、最左と最右の式に注目します。

$$d(x_1, E)\leq d(x_1, x_2)+d(x_2, x)$$

この式は任意の$x$について成り立ちます。$\inf d(x_2, x)=d(x_2, E)$であることに注意して、$d(x_2, x)$に$d(x_2, E)$を代入して左辺に移項すると

$$d(x_1, E)-d(x_2, E)\leq d(x_1, x_2)$$

$x_1$と$x_2$を入れ替えてもこの関係は成り立つので

$$d(x_2, E)-d(x_1, E)\leq d(x_2, x_1)$$

距離の定義から$d(x_1, x_2)=d(x_2, x_1)$が成り立つことに注意して、上の2式をまとめると

$$|d(x_1, E)-d(x_2, E)|\leq d(x_1, x_2)$$

左辺の絶対値は距離の尺度とみなせます。すなわち

$$d(f(x_1), f(x_2))=|d(x_1, E)-d(x_2, E)|$$

すると

$$d(f(x_1), f(x_2))=|d(x_1, E)-d(x_2, E)|\leq d(x_1, x_2)$$

ここで、すべての$\varepsilon>0$について$d(x_1, x_2)<\varepsilon$とすると

$$d(f(x_1), f(x_2))\leq d(x_1, x_2)<\varepsilon$$

$d(x_1, x_2)$は$\varepsilon$に上から抑えられ、$d(f(x_1), f(x_2))$は $d(x_1, x_2)$に上から抑えられることがわかりました。これは、リプシッツ連続の条件そのものです。


2024年5月1日

ユークリッド空間(Metric Space)

※私は数学者ではありません。自分用のまとめとしてこれを書いています。楽しむ範囲でご覧いただければ幸いです。内容の正確性については専門家のサイトや動画、あるいは専門書で必ず確認をお願いします。


*  *  *


今回は、ユークリッド空間が距離空間であることを確認します。


コーシー=シュワルツの不等式
準備として、まずコーシー=シュワルツ(Cauchy-Schwarz)の不等式を紹介します。この不等式にはさまざまな相貌がありますが、ここで使うのに十分な次式を用います。

$$\left(\boldsymbol{ab}\right)^2\leq\boldsymbol{a}^2\boldsymbol{b}^2$$

ここで、$\boldsymbol{a}$ と $\boldsymbol{b}$ はともにベクトルです。この不等式が成り立つことを大まかにみましょう。以下、見やすくするために $a$ と $b$ は太字にしません。少しトリックめいていますが、実数 $t$ に関する式$(at+b)^2$を作り、展開してみます。

$$(at+b)^2=a^2t^2+2abt+b^2$$

左辺は実数を2乗していますので非負です。また、$a\neq 0$であるとき、下に凸な2次関数になります。これらのことに注意して判別式を書くと

$$D=(2ab)^2-4a^2b^2\leq 0$$

$$(ab)^2\leq a^2b^2$$

不等式が得られました。$a=0$であるときも、この式は等式として成り立ちます。


ユークリッド空間
幾何的な分析に有用な距離空間を、古代ギリシャの幾何学者ユークリッドにちなんでユークリッド空間(Euclidean space)といいます。この空間は、距離を測るために生成された$n$ 次元の実数空間$\mathbb{R}^n$です。

この空間内の距離の測りかたとしてひろく知られているのが、いわゆる2乗してルートをとる三平方の定理です。たとえば、座標平面上の原点と$P(1, 2)$の距離は

$$\sqrt{(1-0)^2+(2-0)^2}=\sqrt{5}$$

一般に、$\mathbb{R}^n$に置かれた2点$\boldsymbol{x}, \boldsymbol{x'}$の距離は

$$d=\sqrt{(x_1-x'_1)^2+(x_2-x'_2)^2+…+(x_n-x'_n)^2}$$


距離の定義
この測りかたが距離の定義を満たしていることを確認しましょう。以前の記事に書いた距離の定義を再掲します。

集合$X$から取り出した要素$x_1, x_2, x_3$の距離 $d$ が次の条件を満たすとき、これを距離空間という。

  1.  すべての $x_1, x_2$ について、$0\leq d(x_1, x_2)<\infty$
  2.  $x_1=x_2$ と $d(x_1, x_2)=0$ は同値である
  3.  $x_1\neq x_2$ であるとき $d(x_1, x_2)=d(x_2, x_1)$
  4.  $d(x_1, x_3)\leq d(x_1, x_2)+d(x_2, x_3)$

これらの条件を満たしているか、1つずつ確かめましょう。

まず1つめですが、$d$ に入る数はすべて実数であり、そのすべてを2乗して足していますので、負値は取り得ません。よって$d$ は非負です。$d$ の値が無限に発散しないためには有界性を示さなければなりませんが、私の能力を超えます。ただ、無限の距離を持つものは、そもそも考慮の対象外とするのが自然です。

2つめは、同じ座標に置かれた2点の距離は0であり、距離が0であれば2点は同じ座標に置かれているということです。座標平面に置かれた2点 $P(1, 2)$と$Q(1, 2)$を例にしましょう。これら2点間の距離は、次のように0であることがわかります。

$$PQ=\sqrt{(1-1)^2+(2-2)^2}=0$$

この式の計算結果が0であるのは、ルートの中の各項の引き算の値がすべて0であるときだけです。そして、各項の引き算の値が0になるのは、各項の2つの数がまったく同じ値をとるときだけです。これは2点の座標がまったく同じであることを意味します。

3つめは、こちらからあちらへの距離と、あちらからこちらへの距離は同じであるということです。これはルートの中の各項が2乗されていることから明らかです。上でみた2点$O(0, 0)$と$P(1,2)$を例に式で確かめてみましょう。わざわざ式を書くまでもありませんが…

$$OP=\sqrt{(1-0)^2+(2-0)^2}=\sqrt{5}$$
$$PO=\sqrt{(0-1)^2+(0-2)^2}=\sqrt{5}$$

4つめはいわゆる三角不等式と呼ばれているものです。真っ直ぐゴールへ突き進む距離より、途中でどこかへ立ち寄る距離の方が長いという、これも単純明快なものです。上に掲げた不等式の左辺と右辺にユークリッド距離を代入してみましょう。

 $$左辺=\sqrt{(x_1-x_3)^2}  右辺=\sqrt{(x_1-x_2)^2}+\sqrt{(x_2-x_3)^2}$$

それぞれ2乗すると

 $$左辺=(x_1-x_3)^2  右辺=\left(\sqrt{(x_1-x_2)^2}+\sqrt{(x_2-x_3)^2}\right)^2$$

左辺を若干書き換えて展開すると

$$左辺=((x_1-x_2)+(x_2-x_3))^2=(x_1-x_2)^2+(x_2-x_3)^2+2(x_1-x_2)(x_2-x_3)$$

右辺を展開すると

 $$右辺=(x_1-x_2)^2+(x_2-x_3)^2+2\sqrt{(x_1-x_2)^2}\sqrt{(x_2-x_3)^2}$$

左辺と右辺の違いは第3項だけです。よく見ると、左辺と右辺それぞれの第3項について、係数2を除いて2乗したものの比較はコーシー=シュワルツの不等式そのものです。すなわち

$$((x_1-x_2)(x_2-x_3))^2\leq(x_1-x_2)^2(x_2-x_3)^2$$

定義どおりに$左辺\leq 右辺$が示されました。2乗してルートをとる三平方の定理は距離空間の定義をすべて満たすことがわかりました。この測りかたをする距離空間をユークリッド空間といいます。


2024年4月30日

ベールのカテゴリー定理(Metric Space)

※私は数学者ではありません。自分用のまとめとしてこれを書いています。楽しむ範囲でご覧いただければ幸いです。内容の正確性については専門家のサイトや動画、あるいは専門書で必ず確認をお願いします。


*  *  *


今回はベールのカテゴリー定理についてみます。なんだかどんどん高度になり、クライマーズ・ハイの感じは否めませんが、文系の "だいたい" の話としてみてください。全編とおして完備な距離空間内の話です。


集合のカテゴリー
いくつかの用語を導入することから始めます。内点が取れない閉包を疎集合(nowhere dense set)といいます。そして、この和集合を痩集合(meagre set)、または第1類の集合といいます。これに対して、疎集合の補集合を稠密な開集合(dense open set)といい、痩集合の補集合(稠密な開集合の積集合)を非痩集合(nonmeagre set)、または第2類の集合といいます。痩せているかどうかが集合の名前になるのは面白いです。(meagerという綴りはアメリカ英語だと思います。)

ベール(Baire)という数学者は、完備な距離空間における集合を第1類と第2類に二分できると考えました。これがカテゴリー(category)という考え方です。


ベールのカテゴリー定理
ベールは、カテゴリーに関する次の定理を導きました。

完備な距離空間$(X, d)$内で、非痩集合は$X$について第2類である。

ほぼ定義にしか見えない定理です。ただ、逆は必ずしも真ならず、だそうです。あまりに抽象的で狐につままれた感じがします。ですが、要するにあれかこれか白か黒かという二分法で考えましょう、ということです。物事をカテゴリーで考えるとき、その有用性がわかります。どういうことかというと

$$痩集合=痩集合\cup 非痩集合$$

であれば、右辺の痩集合は自動的に非空集合になります。そして

$$非痩集合=痩集合\cup 非痩集合$$

であれば、右辺の非痩集合は自動的に非空集合になります。このように特徴を二分して、それぞれの特徴を持つカテゴリーに分類されるものが存在するか調べるときに使う感じになりそうです。

もうひとつ、実数直線を例に考えます。有理数は、実数直線上に疎に散らばっています。1つ1つの有理数は他のどの有理数ともつながっていません。それぞれが内点を持たない閉包です。よって、有理数は実数について第1類です。これに対して、開区間$(0, 1)$は実数について第2類です。なぜかというと、この区間は疎ではなく完備だからです。(測度0と正測度のものに集合を二分する、という感じでしょうか…)

節分のときの豆まきを思い浮かべましょう。和室の床(完備な距離空間)に撒かれた豆(点)は疎に散らばっています。足の踏み場もないほどぎっしり埋まることはありません。このような、床が見える状態は第1類です。

これに対して、和室に高級な絨毯を敷くと、その部分は床が見えなくなります。これは第2類です。

*  *  *

今回はとても難しい話でした。また少し理解が進みましたら戻ってきてよりよいものにしたいと思います。


2024年4月29日

リプシッツ連続とバナッハの不動点定理(Metric Space)

※私は数学者ではありません。自分用のまとめとしてこれを書いています。楽しむ範囲でご覧いただければ幸いです。内容の正確性については専門家のサイトや動画、あるいは専門書で必ず確認をお願いします。


*  *  *


今回はリプシッツ連続とバナッハ=ピカールの不動点定理に触れます。これらのトピックスはとても高度ですので、詳細は専門家の動画やサイト、著作等をご覧いただければと思います。ここでは文系の "だいたい" で不動点の物語をお話しします。


リプシッツ連続
距離空間$(X, d)$のすべての要素 $x_1, x_2$ について次が成り立つ写像 $f:X\rightarrow X$ をリプシッツ連続(Lipschitz continuity)といいます。
 
$$d(f(x_1), f(x_2))\leq K\cdot d(x_1, x_2)$$

ここで$K$は非負の値をとる係数です。この係数は様々な値を取り得ますが、そのうち最小の値をリプシッツ定数といいます。この定数を$K_*$と表記しましょう。$K_*<1$のとき、$f(x_1)$と$f(x_2)$の距離が徐々に縮まります。それで、縮小写像(contraction mapping)といいます。


バナッハ=ピカールの不動点定理
完備な距離空間から1点を取り出し、得られた像が入力した点と同じである、すなわち

$$f(x^*)=x^*$$

であるような点 $x^*$を不動点(fixed point)といいます。バナッハ=ピカールの不動点定理(Banach-Picard fixed point theorem)は、不動点が得られる条件と不動点の一意性を次のように示したものです。

完備な距離空間$(X, d)$の写像 $f:X\rightarrow X$ が縮小写像であるとき、この写像の不動点 $x^*$はただひとつ存在する

まず、不動点が得られる条件として、写像が縮小写像であることを指定しています。これは上で説明しましたので繰り返しませんが、縮小写像であることは、距離が徐々に縮まる基礎的な条件です。

不動点が得られるもうひとつの条件として、完備な距離空間を指定しています。完備とは、距離の測定値が必ず見つかるということです。距離を測ろうにも、その値が距離空間の中になければどうしようもありません。空間内には、穴が1つたりともあってはいけません。あらゆる測定値を返せなければなりません。


J.M.ケインズは、その主著『雇用、利子及び貨幣の一般理論』の第23章第5節脚注3に、J. ベンサム "Defence of Usury"の一節を引用しています。Curtuisの沼として知られている一節です。

技芸の轍、すなわち発起人の足跡が刻まれた偉大な道のりは、クルティウスを飲み込んだような裂け目が無数にある広大な、そしておそらくは無辺の地平として考えられるかもしれない。裂け目が閉じるためには、その裂け目に落ちる勇者の犠牲がそれぞれの〔裂け目〕に要求されるが、いったんそれが閉じれば二度と開くことはない。それで、後からやってくる人たちにとって、その道のりははるかに安全になる。(訳文は筆者)


無数の開拓者の失敗によって陥穽が塞がれてはじめて、事業は安全になる、という文脈です。同様に、有理数にある穴すべてが無数の無理数によって完全に塞がれてはじめて、点列は安心して不動点に向かえます。


そしてもうひとつ、とてつもなく重要なのが不動点の一意性です。これをたとえると、集合という宇宙のどこから出発しても、ただひとつの点に行き着くということです。宇宙のすべてを引き寄せる、この上なく強力なブラックホールが宇宙にひとつだけある。フランスの詩人ラ・フォンテーヌは「すべての道はローマに通ず」という名言を遺しましたが、まさにそんな感じです。

宇宙のどこから出発しても答えはひとつというのはいかにも西洋的な、デカルト的な発想ではありますが、不動点定理が強力無比なツールであることは誰も否定できないでしょう。


*  *  *


証明のスケッチ
バナッハ=ピカールの不動点定理の証明をスケッチします。詳細は専門書をご覧ください。まず、縮小写像を逐次的に巻き戻してみます。リプシッツ連続の不等式の$x_1$を$x_3$に、$x_2$を$x_4$に置き換えると

$$d(f(x_3), f(x_4))\leq K_*\cdot d(x_3, x_4)$$

ここで左辺の$f(x_3)$に注目します。$x_3=f(x_2)$と$x_2=f(x_1)$を逐次入れ子(マトリョーシカ:🪆)状に代入すると、$f$ の三重の合成関数になります。

$$f(x_3)=f(f(x_2))=f(f(f(x_1)))$$

これを$f\circ f\circ f\equiv f^3$と表記すると

$$f(x_3)=f^2(x_2)=f^3(x_1)$$

同様に$f(x_4)=f^4(x_1)$となります。これらを左辺に代入すると

$$d(f^3(x_1), f^4(x_1))\leq K_*\cdot d(x_3, x_4)$$

つづいて右辺に注目します。$x_3=f(x_2)$、$x_4=f(x_3)$を代入すると

$$d(f^3(x_1), f^4(x_1))\leq K_*\cdot d(f(x_2), f(x_3))$$

$d(f(x_2), f(x_3))\leq K_*\cdot d(x_2, x_3)$だから

$$d(f^3(x_1), f^4(x_1))\leq K_*\cdot d(f(x_2), f(x_3))\leq K_*\cdot K_*\cdot d(x_2, x_3)$$

この作業を再度繰り返し、最左辺と最右辺の不等式だけ残して書くと

$$d(f^3(x_1), f^4(x_1))\leq K_*\cdot K_*\cdot K_*\cdot d(x_1, x_2)$$

$x_2=f(x_1)$を代入すると

$$d(f^3(x_1), f^4(x_1))\leq K_*^3 d(x_1, f(x_1))$$

これで、すべての写像の入力が点列の1つめの点$x_1$になりました。ここで3を $j$ に一般化すると

$$d(f^j(x_1), f^{j+1}(x_1))\leq K_*^j d(x_1, f(x_1))$$

現状、2点は$j$ 番目と $j+1$ 番目でとなりあっていますが、2つめの点を1つ先に進め、$j+2$番目の点に変えます。すると

$$d(f^j(x_1), f^{j+2}(x_1))\leq K_*^j d(x_1, f(x_1))+K_*^{j+1}d(x_1, f(x_1))$$

2つめの点をもっと先の $k+1$ 番目まで進めると

$$d(f^j(x_1), f^{k+1}(x_1))\leq K_*^j d(x_1, f(x_1))+K_*^{j+1}d(x_1, f(x_1))+…+K_*^{k-1}d(x_1, f(x_1))+K_*^{k}d(x_1, f(x_1))$$

$$d(f^j(x_1), f^{k+1}(x_1))\leq K_*^j\sum_{i=1}^{k-j}K^{i-1}d(x_1, f(x_1))$$

$k$ が無限大に向かうと

$$d(f^j(x_1), f^{\infty}(x_1))\leq K_*^j\sum_{i=1}^{\infty}K^{i-1}d(x_1, f(x_1))$$

$$d(f^j(x_1), f^{\infty}(x_1))\leq K_*^j\frac{d(x_1, f(x_1))}{1-K}$$

$j$ が無限大に向かうと、$0\leq K_*<1$より$K_*^j$は0に向かうので、右辺は0に収束します(コーシー列)。この結果を式にすると

$$d(f^{\infty}(x_1), f^{\infty}(x_1))\leq0$$

$x_1$から始まる点列の行き着く先は$f^{\infty}(x_1)$で、ここから全く動かなくなることがわかりました。不動点を$x^*$とおくと

$$f^{\infty}(x_1)=f(x^*)=x^*$$

最後に一意性を示します。不動点が2つあると仮定し、これを否定する背理法です。$x^*$の他に$x'$というもうひとつの不動点があるとします。これら2点の距離とそれぞれの不動点を導く写像の距離は等しいので

$$d(x^*, x')=d(f(x^*), f(x'))$$

リプシッツ連続の不等式を右につけると

$$d(x^*, x')=d(f(x^*), f(x'))\leq K d(x^*, x')$$

真ん中を除き、最左辺と最右辺の不等式にして変形すると

$$d(x^*, x')\leq K d(x^*, x')$$

$$(1-K)d(x^*, x')\leq 0$$

$0<1-K<1$より、この不等式が成り立つのは$d(x^*, x')=0$のときだけであることがわかります。よって

$$x^*=x'$$

不動点の一意性が示されました。$\Box$


内点、開集合、閉集合、内点集合、集積点、導集合、閉包(Metric Space)

 ※私は数学者ではありません。自分用のまとめとしてこれを書いています。楽しむ範囲でご覧いただければ幸いです。内容の正確性については専門家のサイトや動画、あるいは専門書で必ず確認をお願いします。


*  *  *


前回の記事の終わりに、収束を調べるときには定義域から孤立点を除くことをみました。今回は、孤立点や導集合など、分析に用いるツールをいくつか紹介します。ここでの説明は、すべて距離空間$(X, d)$に関するものであり、$x$は$X$の要素、$E$は$X$の部分集合、$\varepsilon$は任意の小さな正の数とします。


内点、外点、境界点、触点
$x$ とそのすぐそばの点がともに$E$の要素であるとき、$x$ は$E$の内点(interior point)といいます。開球を用いて内点を表記すると

$$B_X(x, \varepsilon)\subset E$$

$E$の補集合$E^c$の内点を外点(exterior point)といいます。開球を用いて外点を表記すると

$$B_X(x, \varepsilon)\subset E^c$$

内点でも外点でもない点を境界点(frontier point)といいます。数直線上の区間のきわ(よく白丸や黒丸で表されるはしっこ)に置かれた点、円の縁に置かれた点、球の表面に置かれた点は境界点です。$x$は$E$の内点、外点、境界点のいずれかになります。

内点と境界点を合わせたものを触点(adherent point)といいます。


開集合と閉集合
$E$の部分集合$E_j$の内点すべてからなる集合を開集合(open set)といい、開集合の補集合を閉集合(closed set)といいます。縁が開いた集合が開集合、縁が閉じた集合が閉集合です。数直線を例にとると開区間は開集合、閉区間は閉集合です。

空集合$\varnothing$と全体集合$X$は開集合かつ閉集合とします。これらは例外的なものとして覚えておきましょう。回りくどく「$E$の部分集合$E_j$」としたのは、次の内点集合との関連からです。


内点集合
$E$の最大の開集合を内点集合とか内部(interior)開核(open kernel)といいます。ここでも数直線を例にとります。$E=[1, 3]$であるとき、$E_1=(1, 2)$、$E_2=(1.5, 2.5)$、$E_3=(2, 3)$はいずれも$E$内の開集合ですが、最大の開集合ではありません。最大の開集合はこれらの和集合、$(1, 3)$です。これを内点集合といいます。

外点をすべて集めた集合を外点集合とか外部(exterior)といい、境界点をすべて集めた集合を境界点集合(frontier)といいます。お互いの積集合はすべて空集合になり、これら3つの和集合は全体集合になります。内点集合を $E^i$、境界点集合を$E^f$、外点集合を$E^e$とおいて表記すると

$$E^i\cap E^f=\varnothing E^i\cap E^e=\varnothing E^f\cap E^e=\varnothing$$
$$E^i\cup E^f\cup E^e=X$$

世界は、風船の中と表面と外からできている、という感じです。


有界
$E$が閉球に収まるとき、$E$は有界(bounded)であるといいます。再び数直線を例にします。開区間$E=(-1, 1)$は閉球$B_X(0, 2)$、すなわち閉区間$[-2, 2]$、に収まります。よって集合$E$は有界です。


集積点と孤立点
$x^*$に向かう収束列 $\{\boldsymbol{x}_j\}$が$E/x^*$の部分集合であるとき $x^*$を$E$の集積点(accumulation point)といいます。

よくわかならい、というのが正直なところだと思います。「なぜ$x^*$を除いた部分集合を考えるのか」と思います。ただ、集積点は幅広い集合に適用できるようによく考えられた概念であることに注意したいです。

見通しをよくするために数直線を例にします。開区間$(0, 1)$と2の和集合を$E$とおきます。$E$の要素である数直線上の点2のように、集合内の他の要素から孤立している要素を孤立点(isolated point)といいます。孤立点に向かう点列を$E$の要素で生成しようがありませんので、孤立点は集積点になり得ません。前にも書きましたが、ゴールが絶海の孤島であるとき、そこへ徒歩で向かえますか? ということです。集積点は、孤立点を集合から除外するのに使えます。

また、集積点は集合に属している必要はありません。引き続き開区間と点の和集合$E$を用います。0は$E$の要素ではありませんが、$E$の集積点です。なぜかというと、$E$の要素で0へ向かう点列を生成できるからです。$\{0.1^j\}$は$E$の部分集合であり、0へ向かう点列の例です。

幅広い集合のようすをつぶさに調べるツールとして集積点は有益です。


導集合と閉包
$E$の集積点すべてからなる集合を$E$の導集合(derived set)といい、 $E^d$と表記します。そして、$E$を部分集合とする最小の閉集合を$E$の閉包(closure)といい、$\overline{E}$と表記します。閉包はまた、触点すべてからなる集合でもあります。集合、導集合、閉包には次のような関係があります。

$$\overline{E}=E\cup E^d$$

再び数直線上の集合$E=(0, 1)\cup 2$を考えます。$E$の導集合は$[0, 1]$です。これは、孤立点である2は集積点ではなく、0と1は集合$E$に属していませんが$E$の集積点であるためです。$E$に属していない$E$の導集合の要素は$E$の境界点ですので、右辺は$[0, 1]\cup 2$となります。0から1までが閉区間に変わります。左辺の閉包は$[0, 1]\cup 2$ですので、上の等式は成り立つことが確かめられます。

$E$が閉集合であるときには、次の関係が成り立ちます。

$$E^d\subset E$$

$E$を閉集合$[0, 1]\cup 2$としましょう。導集合は孤立点を除き、境界点を含みますので、$E^d=[0,1]$となります。よって、$E^d$は$E$より要素2の分だけ小さい集合になります。

また、閉包は内点集合と境界点集合の和集合です。つまり

$$\bar{E}=E^i\cup E^f$$


*  *  *


上限と下限、最大元と最小元
・開集合の場合
数直線の開区間$(0, 1)$を例にします。この開区間には最大元も最小元もありません。しかし、1という上限と0という下限はあります。

・閉集合の場合
数直線の閉区間$[0, 1]$を例にします。この閉区間には1という最大元と0という最小元があります。また、1という上限と0という下限もあります。

これをどう理解するかですが、集合の要素を内点、外点、境界点の3種に分けるとすっきりしそうです。孤立点がない集合について

  • 上界、下界:外点集合と境界点集合
  • 上限、下限:境界点集合
  • 開集合:内点集合
  • 閉集合:内点集合と境界点集合


三分法で眺めると整理しやすそうです。この点、切断により集合は必ず半開区間と開区間に二分されるという連続の公理(デデキントの定理)はあまり強調しすぎないほうがよいのかもしれません…


2024年4月28日

ε-n論法とε-δ論法(Metric Space)

※私は数学者ではありません。自分用のまとめとしてこれを書いています。楽しむ範囲でご覧いただければ幸いです。内容の正確性については専門家のサイトや動画、あるいは専門書で必ず確認をお願いします。


*  *  *


前回の記事の終わりに収束という言葉を用いました。今回は収束を調べる重要なツールであるε-n論法とε-δ論法を紹介します。


ε-n論法
この論法は、点列の収束を調べるときに使います。ここでは前回紹介した収束列を例に概観します。まずは定義を振り返りましょう。距離空間 $(X, d)$内の点列が$X$の元 $x^*$に向かう収束列であるとは

 $$\lim_{j\rightarrow\infty}d( x_j, x^*)=0$$

これと同値な言明は

すべての $\varepsilon$ についてある順番 $\bar{j}$ が存在し、その順番以降のすべての点 $x_j$について $d(x_j, x^*)<\varepsilon$となる。

さらに、開球を用いた同値な言明は

すべての $\varepsilon$ についてある順番 $\bar{j}$ が存在し、その順番以降のすべての点 $x_j$について $x_j\in B_X(x^*, \varepsilon)$となる。

このように、収束の定義に $\varepsilon$ と $n$(ここでは空間の次元に $n$ を用いているので代わりに $j$ で表記しています)が登場することから、イタリックで書いたように点列の収束を調べる方法をε-n論法といいます。

なんだか難しそうですが、点列が小さな球に収まるのであれば、もうそれはどこへも行かずそこに止まるということです。収束とは、もうどこへも行かないということです。


ε-δ論法
この論法は、写像の収束を調べるときに使います。距離空間$(X, d_X)$から孤立点を除いた部分集合 $E$ から $(Y, d_Y)$への写像 $f$ が $x^*$で連続であるとは

 $$\lim_{x\rightarrow x^*}f(x)=f(x^*)$$

これと同値な言明は

すべての $\varepsilon$ について、$d_X(x, x^*)<\delta$ の像が $d_Y(f(x), f(x^*))<\varepsilon$ を満たすような $\delta$ が存在する。

さらに、開球を用いた同値な言明は

すべての $\varepsilon$ について、$x\in B_X(x^*, \delta)$ の像が $f(x)\in B_Y(f(x^*), \varepsilon)$ を満たすような $\delta$ が存在する

さらにコンパクトに表現すると

すべての $\varepsilon$ について、$f(E\cap B_X(x^*, \delta))\subset B_Y(f(x^*), \varepsilon)$ となる $\delta$ が存在する。

プログラミングのコードを書き慣れてくると、できるだけコンパクトに表現したくなりますよね。なんだかそんな感じです。収束の定義に $\varepsilon$ と $\delta$ が登場することから、イタリックで書いたように写像の収束を調べる方法をε-δ論法といいます。

これもとてつもなく難しそうですが、定義域の収束先である$x^*$を中心とする小さな球の中から点を取り出して得られる像は、像の収束先である $f(x^*)$ を中心とする小さな球に収まるということです。出所も行先も収束先のすぐそばというのは、収束の定義そのものです。

ここで定義域から孤立点を除いたのは、$x^*$が孤立点であるとき、そこへ向かう点列を作りようがないためです。絶海の孤島がゴールであるとき、そこへ徒歩で向かえますか? 無理ですよね。それで孤立点をあらかじめ除きます。

集合論の記法は、論理の穴を見つけるのにとても便利だと思います。これまで収束を調べるとき、孤立点について考えたことがありませんでした。『数の落とし子』の動画はとても学びが多いです。このブログの応用編の大半は、動画を拝見した自分なりのまとめノートです。


*  *  *


さらに理解を深めるには、内点、内点集合、集積点、孤立点、導集合、閉包などの用語を知らなければなりません。すべてつながっていることが見えてくると、学びが止まらなくなります。


距離空間の定義、点、点列、部分列、収束列、コーシー列、開球、閉球(Metric Space)

※私は数学者ではありません。自分用のまとめとしてこれを書いています。楽しむ範囲でご覧いただければ幸いです。内容の正確性については専門家のサイトや動画、あるいは専門書で必ず確認をお願いします。


*  *  *


前回の記事で距離空間$(X, d)$を導入しました。距離空間を定義すると次のようになります。

集合$X$から取り出した要素$x_1, x_2, x_3$の距離 $d$ が次の条件を満たすとき、これを距離空間という。

  1.  すべての $x_1, x_2$ について、$0\leq d(x_1, x_2)<\infty$
  2.  $x_1=x_2$ と $d(x_1, x_2)=0$ は同値である
  3.  $x_1\neq x_2$ であるとき $d(x_1, x_2)=d(x_2, x_1)$
  4. $d(x_1, x_3)\leq d(x_1, x_2)+d(x_2, x_3)$

条件1は、私たちの日常感覚に合う条件です。距離は負値を取らず、また無限大にもなりません。条件2は、点の長さを0と定義するということです。条件3は前回の例で

$$d-c=28.9(cm)   c-d=-28.9(cm)$$

と、単純な引き算では異なる値になってしまうことをみました。これは距離の定義を満たしません。定義を満たすには、$d-c$ と $c-d$ の値が等しくなければなりません。このために絶対値という測りかたを導入しました。絶対値で測ると値は同じになり、距離の定義を満たします。

$$|d-c|=|c-d|=28.9(cm)$$

条件4は三角不等式といわれるものです。太っちょの三角定規📐の3辺の長さを例に考えましょう。斜辺は底辺と高さの和より短いです。

$$\sqrt{2}(斜辺)\leq 1(底辺)+1(高さ)$$

のっぽの三角定規の3辺の長さも、この条件を満たします。

$$2(斜辺)\leq 1(底辺)+\sqrt{3}(高さ)$$

距離一般がこの不等式を満たすというのが条件4です。


*  *  *


距離空間$(X, d)$を分析するときによくみる用語をいくつか紹介します。以下、$x$は$X$の要素とします。


距離空間にある距離0の要素を点(point)といいます。距離0の定義は

$$x_1=x_2\iff d(x_1, x_2)=0$$

この定義にしたがって丁寧に書くと、$x_1, x_2$の座標をともに書くべきなのかもしれませんが、表記する座標が全く同じなので、$x_1$または$x_2$の座標のいずれか(どちらを書いても同じですが)を表記します。

数直線上の点の位置は、1つの数で表します。たとえば、数直線上の1に置かれた点の位置は$p=1$と表記します。座標平面上の点の位置は、2つの数の順序組で表します。たとえば、原点から東北へ$\sqrt{2}$だけ離れたところに置かれた点の位置は$P(1, 1)$と表記します。3次元空間内の点の位置は、3つの数の順序組で表現します。たとえば、原点から東北かつ上方$45^{\circ}$へ$\sqrt{3}$だけ離れたところに置かれた点の位置は $P(1, 1, 1)$と表記します。

一般に、$n$ 次元空間内の点の位置は $n$個の数の順序組(n-tuple)で表します。


点列
点を並べた整列集合を点列(sequence of points)といいます。これまで紹介した数学の用語で記述すると、自然数$\mathbb{N}$から整列集合である点への順序同型写像を点列といいます。数直線上の数列は数が並んだものですが、それを$n$ 次元空間に拡張した点列は $n$ 次元ベクトルが並んだものです。一般に、点列を次のように表記します。$x$が太字になっているのは、それぞれの$\boldsymbol{x}$がベクトルであることを強調するためです。

$$\{\boldsymbol{x}_j\}=\boldsymbol{x}_1, \boldsymbol{x}_2, \boldsymbol{x}_3, …$$

数字をふつうの太さで、ベクトルを太字で表記することが望ましいのですが、太字が多くなると読みづらくなる面もあります。そこで、このブログでは点の座標など、ベクトルであることが明らかなときには太字ではなく、ふつうの太さの文字で表記します。たとえば、次のように表記します。

$$\{\boldsymbol{x}_j\}=x_1, x_2, x_3, …$$


部分列
点列の要素の一部を取り出し、順序を保ちながら生成した点列を部分列(subsequence)といいます。たとえば、自然数$\mathbb{N}$から偶数だけ抜き出して$\{2, 4, 6, 8, …\}$と順序を保ちながら並べたものは部分列です。


収束列
点列の十分後ろにゆくと、点の位置がほとんど動かなくなることがあります。このような点列を収束列といいます。点列が$x^*$に向かう収束列であるとは

 $$\lim_{j\rightarrow\infty}d(x_j, x^*)=0$$

$x^*$に向かう収束列は、他の点には向かいません。これを収束の一意性といいます。


コーシー列
収束列の条件を緩めたものにコーシー列(Cauchy sequence)があります。収束列と同じように値がどんどん近づいてゆくイメージですが、収束列では点列があらかじめ定めた点に向かうのに対して、コーシー列では点列どうしの距離が近づいてゆく感じになります。距離空間$(X, d)$内の点列がコーシー列であるとは

 $$\lim_{j, k\rightarrow\infty}d(x_j, x_k)=0$$

ある点列が収束列であればコーシー列です。さらに、コーシー列であれば有界な点列です。よって次のような関係が成り立ちます。

$$収束列\subset コーシー列 \subset 有界列$$


開球と閉球
開区間を概念拡張したものを開球(open ball)といいます。数直線上の開区間 $(-1, -1)$を2次元平面に拡張すると、中心$(0, 0)$、半径1の縁が開いた円になります。さらに、3次元空間に拡張すると中心 $(0, 0, 0)$、半径1の表面が開いた球になります。距離空間では3次元をイメージした語を用いますので、こうしたものを開球といいます。球の中心は0でなくても構いません。一般に、$X$の要素である$x_0$を中心とする半径 $r$ の開球は、次のように表記します。

$$B_X(x_0, r)\equiv\{x\in X | d(x_0, x)<r\}$$

「球」というのは表現上のたとえです。数直線上の距離を考えるとき、開球は球ではなく区間です。平面上の距離を考えるとき、開球は球ではなく円です。3次元空間内の距離を考えるとき、開球は文字どおり球になります。

また、開球と対をなす閉球(closed ball)もあります。これは縁が閉じた球です。すなわち、不等号を等号付き不等号に代えたものです。

$$B_X(x_0, r)\equiv\{x\in X | d(x_0, x)\leq r\}$$


*  *  *


これらの用語はいずれも分析に不可欠なツールです。折にふれ確認しましょう。


2024年4月27日

連続の公理(Metric Space)

※私は数学者ではありません。自分用のまとめとしてこれを書いています。楽しむ範囲でご覧いただければ幸いです。内容の正確性については専門家のサイトや動画、あるいは専門書で必ず確認をお願いします。


*  *  *


切片の復習
「集合のはなし」のシリーズで紹介した、切片について復習するところから始めます。集合$X=\{1, 2, 3, 4, 5, 6, 7\}$の5に関する始切片は、5より前の(小さい)要素を並べた集合ですので

$$IS_X(5)=\{1, 2, 3, 4\}$$

始切片を生成する作業は、集合$X$を下組$\{1, 2, 3, 4\}$と上組$\{5, 6, 7\}$に分割する作業とみなすこともできます。


生じうる分割の種類
一般に、集合$X$を下組$A$と上組$B$に分割したとき、次の条件を満たすものを分割と呼ぶことにしましょう。

  •  $A\neq\varnothing$ かつ $B\neq\varnothing$
  •  $X=A\cup B$
  •  $A$から取り出したすべての要素 $a$ と$B$から取り出したすべての要素 $b$ について、$a<b$

下組$A$と上組$B$の特徴は、次のいずれかの組み合わせになります。

  1.  $A$に最大元があり、$B$に最小元がある
  2.  $A$に最大元があり、$B$に最小元がない
  3.  $A$に最大元がなく、$B$に最小元がある
  4.  $A$に最大元がなく、$B$に最小元がない


前節では、$A=\{1, 2, 3, 4\}$と$B=\{5, 6, 7\}$を得ました。$A$には最大元4があり、$B$には最小元5があります。この組み合わせはケース1に該当します。整列集合などを分割した結果はケース1になります。

整列集合ではない集合、たとえば全順序集合である有理数、を分割するといずれの結果になるでしょうか。有理数全体の集合$\mathbb{Q}$を、有理数0.5までとそれ以降に分割すると

$$A_{\mathbb{Q}}=(-\infty, 0.5]  B_{\mathbb{Q}}=(0.5, +\infty)$$

0.5は$A_{\mathbb{Q}}$に属し、$B_{\mathbb{Q}}$には属しません。$A_{\mathbb{Q}}$の最大元は0.5、$B_{\mathbb{Q}}$の最小元は、0.5以上で最小の有理数を指差確認できませんので、ないと評価します。この組み合わせはケース2に該当します。無理数を含む実数全体の集合$\mathbb{R}$を有理数0.5までとそれ以降に分割しても、結果はケース2になります。

$$A_{\mathbb{R}}=(-\infty, 0.5]  B_{\mathbb{R}}=(0.5, +\infty)$$

分割結果から有理数と実数の区別はつきません。同じものにみえます。ただ、集合の濃度は$|\mathbb{Q}|<|\mathbb{R}|$ですので、両者は明らかに異なります。分割結果からも有理数と実数の違いを特徴づけられるでしょうか。

ここで、実数の存在を知りつつ、有理数の集合だけを問題にするというアクロバティックな状況を考えます。話の見通しをよくするために有理数全体の集合$\mathbb{Q}$を、無理数$\sqrt{2}$を境に分割することを例にします。

$$A_{\mathbb{Q}}=(-\infty, \sqrt{2})  B_{\mathbb{Q}}=(\sqrt{2}, +\infty)$$

$A$と$B$いずれも開区間になりますので、ケース4に該当します。ケース4になるのは、境である$\sqrt{2}$が有理数ではなく無理数であるためです。無理数を含む実数全体の集合$\mathbb{R}$を$\sqrt{2}$までとそれ以降に分割すると、有理数とは異なる結果になります。

$$A_{\mathbb{R}}=(-\infty, \sqrt{2}]  B_{\mathbb{R}}=(\sqrt{2}, +\infty)$$

$A_{\mathbb{R}}$が半開区間になりますので、ケース2に該当します。結果が異なるのは、境である$\sqrt{2}$が有理数ではなく、実数であるためです。


連続の公理
これを有理数と実数の違いとしよう、というのが連続の公理です。つまり、上のケース2とケース3のいずれかだけが生じうる集合だけを連続とみなそう、ということです。言い換えると、実数を超える濃度の数の集合はないと仮定する、ということです。これは公理ですので、真偽を議論する性質のものではなく、こうしておくと後の話がしやすいという性質のものです。

この公理を認めれば、生じうる分割結果で数の種類を区分けできます。

自然数(整列集合):分割の結果、ケース1が生じる

有理数(全順序集合):分割の結果、ケース2, 3, 4が生じうる

実数(連続な全順序集合):分割の結果、ケース2または3が生じうる


実数の空間では、直角三角形の斜辺など、無理数が生じうる距離も測れます。実際に存在する長さを測れるようにしましょう、というのが連続の公理です。


デデキントの定理
連続な全順序集合である実数の空間では、上のケース2とケース3だけが生じうるというのがデデキント(Dedekind)の定理です。上に掲げたケース2とケース3の番号を振り直し、デデキントの定理として再掲します。実数を下組$A$と上組$B$に切断した結果は次のいずれかになります。

  1.  $A$に最大元があり、$B$に最小元がない
  2.  $A$に最大元がなく、$B$に最小元がある

*  *  *


集合の外にあるものを使って集合を分割する、というのはかなりきわどいレトリックです。ただ、定規📏にたとえると、分からなくもないかなとも思います。定規に刻まれたcm単位の目盛りを0と自然数、mm単位の目盛りを有理数とすると、実数は目盛りを書き込んでいる定規の材質にあたります。プラスチックの定規をmm単位の目盛りの間でパチンと割れば、下組と上組が生じます。生じた2片を自然数(cmの目盛り)でみれば2つの半開区間、有理数(mmの目盛り)でみれば2つの開区間、実数(定規の材質)でみれば半開区間と開区間になります。

クランチチョコを2つに割れば、粒々すべてはいずれかの元

ただ、実数が「ベタっと」並んでいるイメージが適切なのかはわかりません。実数の内側から実数を見ている私たちには判断しにくいです。実数の外側から実数を見ると、わかるのかもしれません…

こちらの動画の32分くらいから、面白いです。
https://www.youtube.com/watch?v=DM3kMk9c31Q


2024年4月26日

集合から空間へ(Metric Space)

※私は数学者ではありません。自分用のまとめとしてこれを書いています。楽しむ範囲でご覧いただければ幸いです。内容の正確性については専門家のサイトや動画、あるいは専門書で必ず確認をお願いします。


*  *  *


「集合論のはなし」の次のシリーズについて、少し考えてみました。

  • 確率知りたい! → ルベーグ積分 → リーマン積分 → 関数
  • $L^2$空間!ヒルベルト空間! → まず距離空間 → やはり関数
  • フーリエ変換! → 複素解析 → まず実解析 → またまた関数

解析、代数、幾何という数学の三大分野のうち、現段階では解析っぽいものに興味があるようです。解析の第一歩として、距離空間を次シリーズに選定します。

*  *  *


順序から距離へ
「集合論のはなし」では関係、中でも差を評価する順序や整列についてみました。線分の集合$X=\{a, b, c, d\}$を例に振り返りましょう。$a$ の長さは1cm、$b$ の長さは1cm、$c$ の長さは1.1cm、$d$ の長さは30cmとします。このとき、短い線分から順に並べると

$$a\leq b<c<d$$

これは順序で評価した不等式です。ただ、$b$ と $c$ の長さの差より $c$ と $d$ の長さの差の方がはるかに大きいので、上の不等式はかなりアバウトな印象を与えます。ネットスラングでは「差に差がある」ことを次のように表記するようです。

$$a\leq b<c<<<d$$

これで十分気持ちは伝わりますが、$<<<$ をもう少しうまく表したいところです。試みに長さの差(距離を測ってみます。$a$ と $b$、$b$ と $c$、$c$ と $d$ の長さの差はそれぞれ

$$b-a=0 (cm)$$
$$c-b=0.1 (cm)$$
$$d-c=28.9 (cm)$$

線分の長さの差に違いがあることがはっきりしました。「差の差」を知りたいとき、距離の概念は使えそうです。距離の概念は、ランドセルに30cm定規を差して登校する小学生がいるくらい身近なものでもあります。


距離の測りかた
線分の長さの差のうち、$d-c=28.9(cm)$に注目します。これは、線分 $d$ の長さから線分 $c$ の長さを引いたものです。もし、短い線分 $c$ の長さから長い線分 $d$ の長さを引いてしまうと、測定結果はマイナスになります。

$$c-d=-28.9(cm)$$

私たちは距離を負値で表記しません。非負値で表記します。必ず非負値を返してくれる測りかたに絶対値があります。一般に、2点 $x, y$ の距離を絶対値で測ると

$$|x-y|$$

もうひとつよく知られている距離の測りかたに差を2乗してルートをとる、いわゆる三平方の定理があります。たとえば、2つの格子点$(3, 0)$と$(0, 4)$の距離は

$$\sqrt{(3-0)^2+(4-0)^2}=\pm 5$$

ここでも非負の値、$+5$を取ります。この測りかたをユークリッド距離(Euclidean distance)といいます。こんなふうに距離を測ることができます。


集合から空間へ
ここまでで、順序の概念を少し洗練させて距離の概念を導入しました。では、距離を測れるのはどのような集合でしょうか。この問いについて考えるために、太っちょの三角定規 📐斜辺の長さ、すなわち2つの格子点$(1, 0)$と$(0, 1)$の距離を例に取ります。ユークリッド距離を測ると

$$\sqrt{(1-0)^2+(1-0)^2}=\sqrt{2}$$

$\sqrt{2}$は自然数でも、整数でも、有理数でもありません。実数に含まれる無理数です。身近に存在する距離を要素に持たない自然数、整数、有理数は、ユークリッド距離を測る対象になじみません(完備でない距離空間)。測定法と集合は、取りうる測定値のすべてが、その集合の要素であるような関係であるべきです。ユークリッド距離など、ふつうの測りかたで距離を測れる集合は、実数などに限られます(完備距離空間)。

小学校のとき、私たちは数直線上の距離を測りました。数直線は実数の全体$\mathbb{R}$を線に見立てたものです。中学では、垂直に交わる数直線から成る座標平面上の距離を測りました。座標平面は実数の直積$\mathbb{R}\times\mathbb{R}$を平面に見立てたもので、$\mathbb{R}^2$と表記します。高校では、互いに直交する3本の数直線から成る空間内の距離を測りました。3次元空間は実数の直積 $\mathbb{R}\times\mathbb{R}\times\mathbb{R}$を空間に見立てたもので、$\mathbb{R}^3$と表記します。私たちが学校で距離を測ったのは、あらゆる測定値が集合の中にあるような、注意深く選ばれたフィールド内でのことでした。

一般に、$d$という方法で距離を測る非空な集合$X$を距離空間(metric space)といい、$(X, d)$と表記します。



2024年4月23日

公理と選択公理(Set Theory)

※私は数学者ではありません。自分用のまとめとしてこれを書いています。楽しむ範囲でご覧いただければ幸いです。内容の正確性については専門家のサイトや動画、あるいは専門書で必ず確認をお願いします。


*  *  *


公理とは、議論の前提として、「あらかじめ正しいとしておくこと」です。数学でよくなされる証明は不要です。真であることが証明されない公理が数学にあるのはなぜかというと、これなしに議論しようがないためです。

「木」という文字を例に考えましょう。もし「木」という線分の組み合わせが🌳であったり、💦であったり、✈️であったり、人それぞれ異なるものを意味するのであれば、「木」は文字として使えなくなります。何がなんだか分からなくなります。

足し算を覚えたての小学1年生に「1+1は?」と尋ねると、素直な子は「2!」と元気よく答えますが、いたずら好きな子は「ひまわり!」とか「カレーライス!」とか、おどけて答えることがありますよね。そこは2にしましょうよ、というのが公理です。ともすると宇宙の果てまで飛んでゆく融通無碍な発想をpin downする、レールに乗せるのが公理です。(小学1年生や私たち文系はペアノの公理を知りませんが…)

すべてが自由だったり、すべてを疑ったりしてしまうと、何がなんだか皆目見当がつかなくなります。物事を疑い尽くしたデカルトも、「我思う、故に我あり」という公理に至りました。これは、「少なくとも自分がいる」と仮定しなければ、自分以外のものの存在も、関係も、体系も、何も考えられない。話の出発点として、「自分がいることは確かだと仮定しないとどうしようもない」ということです。

「我思う、故に我あり」は真ではないから公理にふさわしくないという人もいますが、この言明の真偽を論ずる意味はないです。なぜかというと、公理とは「あらかじめ正しいとしておくこと」だからです。仮にこれが正しいとして、何が言えるのかが問題なのであって、これが真か偽かはまた別問題である、というのが公理です。

日本人である私たちは、デカルトの公理を無批判に正しいと評価する必要はありません。ただ、地球の裏側には、これを了解事項として生活している人も多くいるだろうと思うだけです。そういう意味で、公理は文化といえるのかもしれません。


*  *  *


集合論に選択公理というものがあります。選択とは、直積を構成する集合それぞれから要素を選ぶという意味です。この公理の主張は


非空集合$J$で添字付けられた集合族$\{X_j\}_{j\in J}$がある。このとき、すべての $j$ について$X_j\neq\varnothing$であるなら、$X_j$の直積は空集合ではない。つまり

$$\prod_{j\in J}X_j\neq\varnothing$$

ここで

$$\prod_{j\in J}X_j\equiv\left\{f: \{1, 2, ..., J\}\rightarrow\bigcup_{j\in J}X_j|\forall j\in J, f(j)\in X_j\right\}$$


$J$が有限集合であれば真であることが自明とも言えますが、無限集合になるとこれが自明ではなくなるようです。

このとてつもなく難しい公理を、文系の "だいたい" でたとえると…

大宇宙の星々に生息する宇宙人に「私が笛を「ピッ」と吹いたら、各星の代表者1人ずつ一斉に出てきてね。代表者の選び方はそれぞれの星にまかせるから」と伝える。


これができる、すなわち笛を吹いた瞬間に、大宇宙の星々から代表者がサッと立ち現れると仮定しましょうよ、というのがこの公理です。


*  *  *


この公理を認めるとZorn(ツォルン)の補題というものが導け、ツォルンの補題から整列可能性定理というものが導けるようです。

Zornの補題:帰納的半順序集合には、少なくとも1つ極大元がある。

整列可能性定理:選択公理を認め、関係を適切に定めれば、どんな
        集合も整列集合にできる。

こうした言明が意義深いものであったり面白いものであったりするなら選択公理を認めたほうがよいのだと思います。実際、多くの数学者は選択公理を認めているとのことです。

ただこれは、真に数学者の世界です。裾野から霊峰富士を仰ぎ見るのと、頂まで登るのとでは天地雲泥の差があります。私たちが立ち入れる世界では毛頭ありません。頃合いと思いますので、富士の登山口が見えてきたこのあたりで、「集合のはなし」シリーズを閉じたいと思います。

名残惜しい人はこちらへ。(いうまでもなく、この人は私ではありません…)


*  *  *



ここからは、自分向けのメモ(妄想)です。

選択公理は「あなたは無限の世界からいつの間にか有限の世界に至るメビウスの輪の上を歩いていますよ」という呼びかけのような気がします。

・選択公理がある世界:有限と無限の境は溶けない
           同時分散・並列処理ができる

・選択公理がない世界:有限と無限の境が溶ける
           同時分散・並列処理はできない

また、アレフゼロのアレフゼロ乗 $\aleph_0^{\aleph_0}$ を扱うか? という問題でもあるように感じます。


2024年4月21日

集合の関係:整列と比較定理(Set Theory)

※私は数学者ではありません。自分用のまとめとしてこれを書いています。楽しむ範囲でご覧いただければ幸いです。内容の正確性については専門家のサイトや動画、あるいは専門書で必ず確認をお願いします。


*  *  *

前々回の記事から二項関係について考えています。一般に、$X$の直積の部分集合$R\subset X\times X$を二項関係といい、$X$の直積を変域とする命題関数 $(x_1, x_2)\in R$を $x_1 R x_2$と表記します。二項関係には同値、順序、整列などがあります。これらのうち、前回は順序についてみました。この記事では整列についてみます。


整列
全順序$(X, R)$のすべての非空部分集合に最小元があるとき、整列集合(well-ordered set)といいます。ここで非空部分集合とは、部分集合が空集合ではないことを意味します。空集合$\varnothing$とは、お皿に何も載っていないイメージ(🍽️)です。空ではない要素は、お皿に何か食べ物が載っているイメージ(🍛)です。したがって、非空部分集合とは、順序を考える対象がある部分集合ということになります。

自然数$\mathbb{N}=\{1, 2, 3, …\}$は整列集合です。なぜかというと、自然数は全順序であり、かつすべての非空部分集合に最小元があるからです。自然数の部分集合の例を3つ挙げます。

$$\{1\}  \{5, 6, 7, 8, 9, 10\}  \{100, 101, 102, 103, …\}$$

1つめの部分集合の最小元は1、2つめの部分集合の最小元は5、3つめの部分集合の最小元は100です。他の非空部分集合すべてにも最小元があります。よって自然数は整列集合です

自然数は1を始点としますが、整数$\mathbb{Z}$はマイナス無限大まで数の範囲が広がります。無始無終ですので始点がありません。したがって、とりかたによっては部分集合に最小元がないこともあります。よって整数は整列集合ではありません

有理数$\mathbb{Q}$と実数$\mathbb{R}$も整列集合ではありません。これについては、「集合の濃度」の記事で書いた次の文が参考になります。


「実数の数直線上で、1より大きい最小の数は何でしょうか。1.01でしょうか。1より大きく1.01より小さい1.001があるので違います。では1.001はどうかというと、これも違います。1より大きく1.001より小さい1.0001があるからです。では、実数の数直線上で1より大きい最小の数は何かというと、答えようがないですよね…」


実数から部分集合$(1, 2)$を取り出してみましょう。この部分集合は実数の開区間ですので、最小元を見つけられません。よって実数は整列集合ではありません。有理数についても同様の議論から整列集合でないことが確かめられます。

イメージとして、こんな感じでよいのではないでしょうか。

  • 半順序:枝分かれがある、ややこしい順番がついた集合(支線がある路線図など)
  • 全順序:1列にピシッと並ぶが、部分集合を取り出して「一番小さいのはこれ!」と指差し確認できない不思議な順番がついた集合(整数、有理数、実数など)
  • 整列 :1列にピシッと並び、部分集合を取り出して「一番小さいのはこれ!」と指差し確認できる綺麗な順番がついた集合(整数、有限な全順序集合など)


※「集合の切片、最大元と最小元、上限と下限、極大元と極小元」という記事で切片について説明しました。切片は整列集合に適用します。



整列集合の比較定理
整列集合に関する定理として、比較定理というものがあります。これは次のようなものです。

整列集合$(X, R)$、$(Y, S)$について以下のいずれか1つが成り立つ。

  • $(X, R)$と$(Y, S)$は順序同型
  • $(IS_X(\bar{x}), R)$と$(Y, S)$が順序同型となるような $\bar{x}$ が存在する
  • $(X, R)$と$(IS_Y(\bar{y}), S)$が順序同型となるような $\bar{y}$ が存在する


ここで、$IS_X(\bar{x})$は集合$X$の要素 $\bar{x}$ に関する始切片、$IS_Y(\bar{y})$は集合 $Y$の要素 $\bar{y}$ に関する始切片です。3つのうち1つも成り立たないことはなく、また3つのうち2つ以上が成り立つこともありません。3つのうちいずれか1つだけが成り立つという定理です。イメージだけ書くと、1つめは$X$と$Y$の濃度が等しい、2つめは$X$の濃度が$Y$より高い、3つめは $X$の濃度が$Y$より低い状況を描写したものと思われます。

「こんなの当たり前だよ…」と思われることも、数学ではとてつもなく丁寧に確かめます。正に「石橋を叩いて渡る」です。当たり前にみえることを早合点しないのが、上達の近道なのかもしれません。私たち文系は、気軽に「ロジック、ロジック」と言いますが、本当のロジックを知っている人の前で「ロジック」という言葉は気軽に使わない方がよいのかもしれません。


*  *  *


集合の特徴を調べるツールとして、写像、濃度、関係(同値、順序、整列)があります。



集合の関係:順序と順序同型(Set Theory)

※私は数学者ではありません。自分用のまとめとしてこれを書いています。楽しむ範囲でご覧いただければ幸いです。内容の正確性については専門家のサイトや動画、あるいは専門書で必ず確認をお願いします。


*  *  *

前回の記事から、二項関係について考えています。一般に、$X$の直積の部分集合$R\subset X\times X$を二項関係といい、$X$の直積を変域とする命題関数 $(x_1, x_2)\in R$を $x_1 R x_2$と表記します。二項関係には同値、順序、整列などがあります。これらのうち、前回は同値についてみました。この記事では順序についてみます。


順序
集合$X$の順序 $(\leq)$を調べる二項関係を$(X, \leq)$と表記します。順序には前順序、半順序、全順序があります。これらのうち前順序(preoder)とは、次の2条件を満たす二項関係です。

反射律:すべての$x$について、$x\leq x$が真
推移律:すべての$x_1, x_2, x_3$について、$x_1\leq x_2$が真かつ$x_2\leq x_3$
    が真であれば、$x_1\leq x_3$は真

なんだか難しそうですが、$X=\{2, 4, 6\}$を例に考えればすぐわかります。まず、反射律ですが

$$2\leq 2  4\leq 4  6\leq 6$$

これらの式は等号の意味で満たされています。つづいて推移律ですが

$$2\leq 4  かつ  4\leq 6  ならば  2\leq 6$$

明らかに$2\leq 4$は真、かつ$4\leq 6$は真です。そして$2\leq 6$も真です。難しそうにみえますが、順序は小学1年生から使っている概念です。上の2条件に加え、次に示す反対称律も満たす二項関係を半順序(partial oder)といいます。

反対称律:すべての$x_1, x_2$について、$x_1\leq x_2$が真かつ$x_2\leq x_1$が真
     であれば、$x_1=x_2$は真

同値の条件の1つに対称律がありましたが、半順序の条件の1つは対称律であることに注意しましょう。反対称律も難しくありません。たとえば、集合$X$から$x_1=2$、$x_2=4$を取り出してみましょう。このとき

$$2\leq 4  は真だが  4\leq 2  は偽$$

となります。異なる要素を取り出すと、不等式のいずれかが偽になってしまいます。2つの不等式ともに真であるためには $x_1=x_2$でなければなりません。たとえば、$x_1=4$、$x_2=4$を取り出してみましょう。このとき

$$4\leq 4  かつ  4\leq 4  ならば  4=4$$

と反対称律を満たします。反射律、推移律、反対称律に加え、完備律も満たす二項関係を全順序(total order)といいます。

完備律:$(X, \leq)$が半順序であるとする。このとき、すべての$x_1, x_2$
    について$x_1\leq x_2$が真、または$x_2\leq x_1$が真

全順序は鎖(chain)、線形順序(linear order)もいわれます。不等号を基準に、集合のすべての要素が綺麗に一列に並びます。呼び名には「順序に枝分かれを許さない」という強いメッセージが込められています。

「順序を前順序、半順序、全順序に分けるのはなぜですか」という問いには、「ド・モルガンの法則は完備律を満たす全順序に適用できるが、半順序と前順序には適用できない」と答えるのがよさそうです。前につく否定を外すとき、不等号の向きをひっくり返す操作ができる二項関係は全順序と整列です。この点は、数々の補題や定理を証明するとき、大きな意味を持ちます。

半順序であるが全順序ではない二項関係の例は込み入ります。関係$\leq$を集合の包含関係や自然数の割り切れる商などに読み替える例のようです。こちらの動画をご覧ください。

次の動画では半順序と全順序の違いについて、イメージできる解説をしています。いくつかの支流から本流に流れ込む川の流れや入れ子構造の集合を例にしています。

順序には、完全律や三分律といった条件もありますが、ここでは割愛します。詳細は『WIIS』の説明をご参照ください。


順序同型
2つの集合 $X=\{1, 2, 3\}$ と $Y=\{みかん, りんご, いちご\}$ について、順序 $(X, \leq)$ と $(Y, \leq)$ を考えます。ここで、$X$の$\leq$は小さい数から大きい数への順序、$Y$の$\leq$は一番安いみかん、二番目に安いりんご、三番目に安いいちごという果物の値段についての順序だとします。これらの順序集合を関係づける次のような写像 $f$ を与えます。

$$1\stackrel{f}{\mapsto}みかん$$ 
$$2\stackrel{f}{\mapsto}りんご$$ 
$$3\stackrel{f}{\mapsto}いちご$$ 

写像 $f$ は、$X$の一番目の要素の像が$Y$の一番目の要素、$X$の二番目の要素の像が$Y$の二番目の要素、$X$の三番目の要素の像が$Y$の三番目の要素になっています。この $f$ のような、2つの集合の順序を損ねない写像を順序を保つ写像といいます。

順序を保つ写像が全単射であるとき、順序同型写像といい、順序同型写像で関係づけられる2つの順序集合を順序同型(order isomorphic)といいます。一般に、順序集合$(X, R)$、$(Y, S)$、$(Z, T)$について、以下が成り立ちます。


  • $(X, R)$と$(X, R)$は順序同型
  • $(X, R)$と$(Y, S)$が順序同型であれば、$(Y, S)$と$(X, R)$も順序同型
  • $(X, R)$と$(Y, S)$が順序同型、かつ$(Y, S)$と$(Z, T)$が順序同型であれば、$(X, R)$と$(Z, T)$は順序同型


これらはそれぞれ同値関係の反射律、対称律、推移律のイメージです。



2024年4月20日

集合の関係:同値(Set Theory)

※私は数学者ではありません。自分用のまとめとしてこれを書いています。楽しむ範囲でご覧いただければ幸いです。内容の正確性については専門家のサイトや動画、あるいは専門書で必ず確認をお願いします。


*  *  *


前の記事で、集合の要素の始めとか終わり、集合の要素が小さいとか大きいという語を用いました。これらの表現は、集合の要素に何らかの関係(前後関係、大小関係など)があるという前提で用いています。この記事ではこの前提、すなわち集合の関係について考えます。

順序対と直積
2つの集合$X=\{1, 2, 3\}$と$Y=\{みかん, りんご, いちご\}$を例にとります。これらの集合から1つずつ要素を取り出して順に並べたものを順序対(order pair)といいます。たとえば、(1, みかん)のペアは順序対です。2つの集合から生成される順序対をすべて書き出したものを直積(Cartesian product)といいます。直積$X\times Y$の要素は次の9ペアです。

$$(1, みかん), (1, りんご), (1, いちご),$$
$$(2, みかん), (2, りんご), (2, いちご),$$
$$(3, みかん), (3, りんご), (3, いちご)$$

順序対は、名が示すとおり順序が重要です。数字の集合$X$どうしの直積 $X\times X$を例に考えましょう。わかりやすくするために右の$X$をオレンジ色にします。$X\times$Xの要素をすべて書き出すと

(1, 1), (1, 2), (1, 3),
(2, 1), (2, 2), (2, 3),
(3, 1), (3, 2), (3, 3)

(2, 1)と(1, 2)は異なります。(3, 1)と(1, 3)、(3, 2)と(2, 3)も異なります。数字のペアだと前後入れ替えても同じに思えますが、順序対では順序にこだりますので、異なると考えます。


二項関係
直積から取り出した順序対に何らかの評価を下すことを二項関係(binary relation)といいます。数の集合$X=\{1, 2, 3\}$の直積から、要素を1つずつ取り出して順序対を作りましょう。

$$(1, 2)\in X\times X$$

ここで、1つめの$X$から取り出した要素1と2つめの$X$から取り出した要素2の関係を調べてみましょう。「1は2以下である」という大小関係は、真偽を確かめられますので命題です。この命題は明らかに真です。こうした真偽の判定は、直積の他の要素についてもできます。

一般に、$X$の直積の部分集合$R\subset X\times X$を二項関係といい、$X$の直積を変域とする命題関数$(x_1, x_2)\in R$を $x_1 R x_2$と表記します。二項関係には同値、順序、整列などがあります。この記事では同値についてみます。


同値
次の3条件を満たす二項関係を同値(equivalence relation)といい、記号$\sim$で表します。

反射律:すべての$x$について、$x\sim x$が真
対称律:すべての$x_1, x_2$について、$x_1\sim x_2$が真なら$x_2\sim x_1$も真
推移律:すべての$x_1, x_2, x_3$について、$x_1\sim x_2$が真かつ$x_2\sim x_3$が
    真なら$x_1\sim x_3$も真

同値の概念から同値類(equivalence class)商集合(quotient set)を定義できます。$x_1$の同値類$[x_1]$とは、$x$ のうち、$x_1\sim x$ が真であるものすべてです。そして、商集合$X/\sim$とは、$X$の同値類すべて、すなわち

$$X/\sim=\{[x]|x\in X\}$$

です。集合$X$を同値類で余りなく分割(割り算)するイメージですので「商」集合といいます。果物の集合

$$X=\{みかん, りんご, いちご, ぶどう, すいか, なし\}$$

の同値類と商集合を考えましょう。この集合の要素のうち、最も好きなものがみかんとりんご、次に好きなものがいちご、ぶどう、すいか、そして相対的に最も好きではないものがなしだとします。このとき、みかんを代表元とする同値類は

$$[みかん]=\{みかん, りんご\}$$

同様に、いちご、なしを代表元とする同値類は

$$[いちご]=\{いちご, ぶどう, すいか\}$$
$$[なし]=\{なし\}$$

です。商集合はこれら3つの同値類から成ります。確かにこれらの同値類で集合$X$のすべての要素を余りなくカバーしています。

$$X/\sim=\{[みかん], [いちご], [なし]\}$$


集合の切片、最大元と最小元、上限と下限、極大元と極小元(Set Theory)

※私は数学者ではありません。自分用のまとめとしてこれを書いています。楽しむ範囲でご覧いただければ幸いです。内容の正確性については専門家のサイトや動画、あるいは専門書で必ず確認をお願いします。


*  *  *


集合論に切片(segment)という用語があります。これは、1次関数のグラフの切片(intercept)とは異なります。1つの用語が複数の意味を持つとややこしくなりますので、翻訳するとき変えてほしかったです。英語では、segment:切り落とした後に残った部分との違いが明らかですので…

切片には、始切片(initial segment)終切片(final segment)があります。集合の後のほうを切り落とした後、残った前のほうを始切片といいます。集合の前のほうを切り落とした後、残った後ろのほうを終切片といいます。ここでは、=を含む広義の切片ではなく、=を含まない狭義の切片について考えます。

集合$X=\{1, 2, 3, 4, 5, 6, 7\}$を例にとります。この集合の要素5に関する始切片$IS_X(5)$は、$X$の要素のうち5より前の(小さい)ほうを集めた集合ですので

$$IS_X(5)=\{1, 2, 3, 4\}$$

となります。この始切片の要素のうち、終わり(最大)の要素である4を最大元(maximum element)といいます。そして、始切片の外にあり、後ろ(上)から始切片を抑える要素の集合$\{5, 6, 7\}$を上界(upper bound)、上界のうち始め(最小)の要素である5を最小上界(least upper bound)とか上限(supremum)といいます。

同様に、この集合の要素3に関する終切片$FS_X(3)$は、$X$の要素のうち3より後ろの(大きい)ほうを集めた集合ですので

$$FS_X(3)=\{4, 5, 6, 7\}$$

となります。この終切片の要素のうち、始め(最小)の要素である4を最小元(minimum element)といいます。そして、終切片の外にあり、前(下)から終切片を抑える要素の集合$\{1, 2, 3\}$を下界(lower bound)、下界のうち終わり(最大)の要素である3を最大下界(greatest lower bound)とか下限(infimum)といいます。


*  *  *


この記事では、要素が一列に並ぶ集合$X=\{1, 2, 3, 4, 5, 6, 7\}$を例にしました。次回以降の記事で説明するように、集合の要素の関係には、分枝や合流を含むものもあります。こうした複雑な関係を絵にしたものがハッセ図です。

リンク先の図表に現れる、分枝内の順序はあるが、枝を越えて順序づけはしない、比較的緩やかな順序を半順序といいます。この半順序に適用するのが極小元(minimal element)極大元(maximal element)です。最小元と最大元がある半順序集合の各分枝に注目すると、それぞれの分枝の始めの要素が極小元、終わりの要素が極大元です。分枝ごとに極小元と極大元を考えることができますので、1つの集合に複数の極小元と極大元がありえます。大まかに、分枝ごとの行き止まりのイメージです。


*  *  *


整列、半順序、全順序など、集合の要素の関係については次回以降の記事で詳しくみます。この記事で紹介した用語は今後も使いますので、その都度振り返りましょう。