文系の "だいたい" 数学: 5月 2024

2024年5月13日

収束、上極限、下極限、ファトゥの補題（Lebesuge Measure）

※私は数学者ではありません。自分用のまとめとしてこれを書いています。楽しむ範囲でご覧いただければ幸いです。内容の正確性については専門家のサイトや動画、あるいは専門書で必ず確認をお願いします。

* * *

前回、σ加法族を紹介しました。今回はファトゥの補題を紹介します。これはとてつもなく難しいものですので、大まかなイメージを持てるところまでを目標にします。

収束と極限

数列の先のほうの値が変わらなくなるとき、収束する（converge）といいます。たとえば

$$2+\left(-\frac{1}{2}\right)^j$$

という数列を書き表すと

$$\left\{2+\left(-\frac{1}{2}\right)^1, 2+\left(-\frac{1}{2}\right)^2, 2+\left(-\frac{1}{2}\right)^3, …\right\}$$

この数列は、2を境に上下しながら限りなく2に近づいてゆきます。このとき、この数列は2に収束するといいます。数列には、収束せずに発散する（diverge）ものや振動したまま（oscillate）のものもありますがこの記事では有限な値に収束する数列について考えます。また、数列を集合に見立てた$A_j$はすべての $j$ について可測とします。

上極限と下極限

数列が収束するとき、その数列の一部を抜き出して作成した部分列も収束します。そのようすをみるものを上極限といいます。上の数列を例にしましょう。もとの数列は

$$\left\{2+\left(-\frac{1}{2}\right)^1, 2+\left(-\frac{1}{2}\right)^2, 2+\left(-\frac{1}{2}\right)^3, …\right\}$$

これは2に収束します。この数列から偶数番の要素だけ取り出すと

$$\left\{2+\left(-\frac{1}{2}\right)^2, 2+\left(-\frac{1}{2}\right)^4, 2+\left(-\frac{1}{2}\right)^6, …\right\}$$

これは最小上界（上限）が上から2に向かい収束します。この数列から4の倍数番の要素だけ取り出すと

$$\left\{2+\left(-\frac{1}{2}\right)^4, 2+\left(-\frac{1}{2}\right)^8, 2+\left(-\frac{1}{2}\right)^{12}, …\right\}$$

これも最小上界（上限）が上から2に向かい収束します。このように、もとの数列から作成した部分列の収束先は、もとの数列の収束先と同じことを確かめられます。これは、各部分列の最小上界（上限）を集めてその極限をとる作業ですので、次のように表記できます。

$$a^*=\lim_{j\rightarrow\infty}\sup A_j$$

同様に、減衰曲線の下からの収束をみるときには、各周期の極小値からなる部分列を作り、そのようすをみるのが賢明です。たとえば、奇数番だけ取り出すと

$$\left\{2+\left(-\frac{1}{2}\right)^1, 2+\left(-\frac{1}{2}\right)^3, 2+\left(-\frac{1}{2}\right)^5, …\right\}$$

これは最大下界（下限）が下から2に向かい収束します。各部分列の最大下界（下限）を集めてその極限をとる作業は、次式のように表記できます。$a_*$は下極限です。

$$a_*=\lim_{j\rightarrow\infty}\inf A_j$$

上極限と下極限が存在するとき、次の式が成り立ちます。

$$\lim_{j\rightarrow\infty}\inf A_j\leq\lim_{j\rightarrow\infty}\sup A_j$$

上極限$a^*$と下極限$a_*$が等しいとき、極限が存在するといいます。このとき、上の不等式は等号で成り立ちます。

集合の記法

集合の記法で上極限を表してみましょう。上の例を再び掲げると

$$A_1=\left\{2+\left(-\frac{1}{2}\right)^1, 2+\left(-\frac{1}{2}\right)^2, 2+\left(-\frac{1}{2}\right)^3, …\right\}$$

$$A_2=\left\{2+\left(-\frac{1}{2}\right)^2, 2+\left(-\frac{1}{2}\right)^4, 2+\left(-\frac{1}{2}\right)^6, …\right\}$$

$$A_3=\left\{2+\left(-\frac{1}{2}\right)^4, 2+\left(-\frac{1}{2}\right)^8, 2+\left(-\frac{1}{2}\right)^{12}, …\right\}$$

$A_1$の最小上界は$2+\left(-\frac{1}{2}\right)^2$、$A_2$の最小上界は$2+\left(-\frac{1}{2}\right)^2$、$A_3$の最小上界は$2+\left(-\frac{1}{2}\right)^4$です。これらのうち最小の$2+\left(-\frac{1}{2}\right)^4$は$A_3$の要素ですが、$A_1$の要素でもあり、$A_2$の要素でもあります。すなわち

$$2+\left(-\frac{1}{2}\right)^4\in A_1\cup A_2\cup A_3$$

であり、かつ

$$2+\left(-\frac{1}{2}\right)^4\in A_1\cap A_2\cap A_3$$

また同様に

$$2+\left(-\frac{1}{2}\right)^4\in A_2\cup A_3$$

であり、かつ

$$2+\left(-\frac{1}{2}\right)^4\in A_2\cap A_3$$

さらに

$$2+\left(-\frac{1}{2}\right)^4\in A_3$$

つまり、収束先の候補は、最小上界の候補となる集合をすべて集め、そのいずれにも入っている要素だということになります（簡単化のためにこのようになる部分列を作成しました）。集合の記法では、候補をすべて集めることを$\bigcup$で、いずれにも入っていることを$\bigcap$で表します。よって

$$収束先の候補=2+\left(-\frac{1}{2}\right)^4\in A_3\subset\bigcap_{j=1}^{3}\bigcup_{n=j}^{3}A_n$$

調べる集合の数を増やすにしたがい、収束先の候補が絞り込まれるイメージです。3を3より大きい$J$に一般化すると、候補はさらに絞られます。

$$A_J\subset\bigcap_{j=1}^{J}\bigcup_{n=j}^{J}A_n$$

測度の単調性から

$$\mu(A_J)\leq\mu\left(\bigcap_{j=1}^{J}\bigcup_{n=j}^{J}A_n\right)$$

$J$を限りなく大きくすると（記述の煩雑さを避けるために$J$を $j$ に置き換えています）

$$\lim_{j\rightarrow\infty}\sup\mu(A_j)\leq\mu\left(\bigcap_{j=1}^{\infty}\bigcup_{n=j}^{\infty}A_n\right)$$

下極限は、上極限と対称をなしますので（と簡単に書くとお叱りを受けますが…）

$$\mu\left(\bigcup_{j=1}^{\infty}\bigcap_{n=j}^{\infty}A_n\right)\leq\lim_{j\rightarrow\infty}\inf\mu(A_j)$$

※集合の記法はとても難しいです。こちらを参照しました。

https://wiis.info/math/set/set/limsup-and-liminf-of-sets/

こちらは英語ですが、とてつもなくhelpfulです。

https://www.youtube.com/watch?v=PZ0UhM9IB_k

ファトゥの補題

ここまでの結果をまとめると、数列の上極限と下極限を集合の上極限と下極限ではさみこむことができます。すなわち、$\mu(\bigcup_{j=1}^{\infty}A_j)$が有限であるとき、次の不等式が成り立ちます。

$$\mu\left(\bigcup_{j=1}^{\infty}\bigcap_{n=j}^{\infty}A_n\right)\leq\lim_{j\rightarrow\infty}\inf\mu(A_j)$$

$$\leq\lim_{j\rightarrow\infty}\sup\mu(A_j)\leq\mu\left(\bigcap_{j=1}^{\infty}\bigcup_{n=j}^{\infty}A_n\right)$$

これを極限の記法で書くと

$$\mu(\lim_{j\rightarrow\infty}\inf A_j)\leq\lim_{j\rightarrow\infty}\inf\mu(A_j)$$

$$\qquad\qquad\leq\lim_{j\rightarrow\infty}\sup\mu(A_j)\leq\mu(\lim_{j\rightarrow\infty}\sup A_j)$$

この結果をファトゥの補題（Fatou's lemma）といいます。「ファトゥの補題はルベーグ積分に関するもので、集合に関するものではない」と言われるかもしれません。この後少しずつ学ぶと見えてくると思いますが、ルベーグ＝カラテオドリの測度はそのままルベーグ積分です。積分の記法で書くと（証明は『数の落とし子』の方がされています。今の私にはとても追いきれませんでした。こちらもあわせて参照しました。）

$$\int\lim_{j\rightarrow\infty}\inf f_j d\mu\leq\lim_{j\rightarrow\infty}\inf\int f_j d\mu$$

$$\qquad\qquad\leq\lim_{j\rightarrow\infty}\sup\int f_j d\mu\leq\int\lim_{j\rightarrow\infty}\sup f_j d\mu$$

積分は測度の一形態であるとは、ルベーグの慧眼です。

2024年5月8日

σ加法族（Lebesgue Measure）

* * *

前回は集合族の測度についてみました。今回は、σ加法族について紹介します。

本格的に確率を学びたいと思って専門書を開くと、たいがい1ページ目にσ加法族が登場します。私たちの大半は、この用語を見た瞬間に頭が真っ白になり、開いたばかりの本を閉じ、図書館の書棚にそっと返してしまいます。この段階をなんとか超えたいな、と思います。

べき集合

集合$A$の要素からなるすべての部分集合の集まりをべき集合（power set）といい、$2^A$と表記します。2の$A$乗と書くのは、$A$の要素の数が$A$個あるとき、べき集合の要素の数は$2^A$個存在するためです。

コイントスの結果、表が出ることを1、裏が出ることを2としましょう。これは、2つの要素からなる集合として表記できます。

$$A=\{1, 2\}$$

$A$のべき集合は

$$2^A=\{\varnothing, 1, 2, \{1, 2\} \}$$

確かに要素の数は$2^A=2^2=4$個あります。集合の要素の数が3なら8、4なら16の要素がべき集合にあります。

σ加法族

準備が整いましたので、σ加法族を定義します。集合$X$のべき集合 $2^X$を$\mathcal{F}$とおき、$A$を$\mathcal{F}$の任意の要素とします。このとき、次の条件を満たす$\mathcal{F}$をσ加法族（σ-field, σ-algebra）といいます。

$\varnothing\in\mathcal{F}$
$A\in\mathcal{F} \implies A^c\in\mathcal{F}$
$\{\boldsymbol{A}_j\}\subset\mathcal{F} \implies \bigcup_{j=1}^{\infty}A_j\in\mathcal{F}$

1つめは、空集合が$\mathcal{F}$の要素であるということです。上のコイントスの例でも、べき集合の要素に空集合がきちんと入っています。

2つめは、これが$\mathcal{F}$の要素ならこれ以外も$\mathcal{F}$の要素だということです。コイントスの例では「表が出る：1」と「裏が出る：2」はともに$\mathcal{F}$の要素です。同様に「表か裏が出る： $\{1, 2\}$」と表も裏も出ない、すなわち「空集合：$\varnothing$」はともに$\mathcal{F}$の要素です。

3つめは、可算無限の集合列の要素すべてが$\mathcal{F}$の要素なら、その和集合も$\mathcal{F}$の要素だということです。コイントスの例は有限集合ですが、気持ちだけ眺めると…

$$\{\varnothing, 1, 2, \{1, 2\} \}$$

のすべての要素の和集合は$ \{1, 2\}$です。これは明らかに$\mathcal{F}$の要素です。

条件2と条件3を用いれば、$\bigcap_{j=1}^{\infty}A_j$も$\mathcal{F}$の要素だと確かめられます。条件2から、$A\in\mathcal{F}$なら$A^c\in\mathcal{F}$です。条件3から、その和集合も$\mathcal{F}$の要素です。すなわち

$$\{\boldsymbol{A}_j^c\}\subset\mathcal{F} \implies \bigcup_{j=1}^{\infty}A_j^c\in\mathcal{F}$$

再び条件2から

$$\left(\bigcup_{j=1}^{\infty}A_j^c\right)^c=\bigcap_{j=1}^{\infty}A_j\in\mathcal{F}$$

σ加法族は、測る場としてよい性質を持っています。コイントスの例では、表が出る確率、裏が出る確率、表か裏が出る確率、表も裏も出ない確率、起こりうる事象すべてを確率の計測対象にできます。確率を測る場として心地よいです。

確率などを測れる場という意味で、集合$F$から生成されたσ加法族$\mathcal{F}$を可測空間（measurable space）といい、$(F, \mathcal{F})$と表記します。確率論の専門書によく$(\Omega, \mathcal{F}, P)$と書いてありますが、これは可測空間を確率測度$P$で測ること意味しています。

* * *

σ加法族の生成

もとの集合$F$からσ加法族を作成することもできます。集合$F$から最小のσ加法族を作成する作業を生成（generate）といいます。集合$F$から生成されたσ加法族を$\sigma(F)$と表記します。

上で用いたコイントスの例を少しだけ拡張してみましょう。コインを2回投げた結果は次の4とおりです。

$4=\{表, 表\}$

$3=\{表, 裏\}$

$2=\{裏, 表\}$

$1=\{裏, 裏\}$

それぞれに4から1までの番号をつけました。これらを集めた集合$F$は次のようになります。

$$F=\{1, 2, 3, 4\}$$

この集合から生成されるσ加法族$\sigma(\{1, 2\})$は

$$\sigma(\{1, 2\})=\{\varnothing, F, \{1, 2\}, \{3, 4\}\}$$

となります。これがσ加法族であることを確かめましょう。この記事のはじめに書いた３条件のうちの1つめは、空集合がσ加法族の要素であるということです。空集合は確かに$\sigma(\{1, 2\})$の要素です。

３条件のうちの2つめは、補集合がσ加法族の要素であるということです。ここまでで$\sigma(\{1, 2\})$の要素になっているのは$\{\{1, 2\}, \varnothing\}$です。これらの補集合はそれぞれ

$$\{1, 2\}^c \implies \{3, 4\}$$

$$\varnothing^c \implies F$$

確かにこれらも$\sigma(\{1, 2\})$の要素です。３条件のうちの3つめは、生成されたσ加法族のすべての要素の和集合が$\sigma(\{1, 2\})$の要素であるということです。

$$F=\varnothing\cup F\cup\{1, 2\}\cup\{3, 4\}$$

は明らかです。よって、３条件すべてを満たす$\sigma(\{1, 2\})$は集合$E$から生成されたσ加法族だといえます。

* * *

とりかかりは、これくらいでいいかなと思います。

見通しを立てたい人は、こちらへ。

https://www.youtube.com/watch?v=PvQpZ_ZlU9A

ルベーグ測度の世界では零集合が決定的な役割を果たすように思います（志賀浩二『ルベーグ積分30講』pp.52-53）。おおげさかもしれませんが、虚数単位 $i$ と同じくらいの役割を果たしていそうです。そのうちだんだんみえてくるでしよう…

可測集合族の測度（Lebesgue Measure）

* * *

前回は様々な集合の可測性を調べました。今回はそのつづきです。集合の重なりがないときの測度、集合がずらりと並ぶ集合族と集合列の測度についてみます。

素集合

素（disjoint）とは、重なっていないということです。たとえば、神奈川県と秋田県は地図上で重なっていません。「この番地は神奈川県であり、秋田県でもあります」というところはないはずです。集合$A$と$B$の両方に入る要素が1つもないことを互いに素といい、そのような集合を素集合（disjoint sets）といいます。式で書くと

$$A\cap B=\varnothing$$

$A$と$B$が可測であるとき、素集合の測度は$A$の測度と$B$の測度の和と等しくなります。

$$\mu(A\cup B)=\mu(A)+\mu(B)$$

神奈川県と秋田県を合わせた面積は、神奈川県の面積と秋田県の面積の和に等しいという、私たちの感覚に合う結論が測度の世界でも得られます。

集合族

つづいて、集合を有限個並べて集合にしたもの$\{A_1, A_2, A_3, …, A_J\}$について考えます。こうしたものを集合族（familiy of sets）といいます。すべての要素が可測集合である集合族の和集合と積集合は、ともに可測です。すなわち

$$\bigcap_{j=1}^JA_j　　　　\bigcup_{j=1}^JA_j$$

はともに可測です。すべての$j\neq k$について$A_j\cap A_k=\varnothing$であれば、和集合の測度は完全加法性を満たします。すなわち

$$\mu\left(\bigcup_{j=1}^JA_j\right)=\sum_{j=1}^J\mu(A_j)$$

47都道府県からなる日本国の面積は各都道府県の面積の和であるというこの結論は、私たちの感覚に合います。数学は難しいものではありますが、奇を衒った突拍子もないものではありません。大半は極めて常識的なものです。

集合列

さらに、集合を可算無限個並べた集合$\{A_1, A_2, A_3, …\}$に拡張しましょう。こうしたものを集合列（sequence of sets）といいます。すべての$j\neq k$について$A_j\cap A_k=\varnothing$であれば、可測な集合列の和の測度も完全加法性を満たします。すなわち

$$\mu\left(\bigcup_{j=1}^{\infty}A_j\right)=\sum_{j=1}^{\infty}\mu(A_j)$$

集合列の要素がどんどん大きくなるとき、すなわち、すべての $j$ について $A_j\subset A_{j+1}$であるとき、単調増加な集合列といいます。この和の測度は最後の、つまり最大の要素の測度に収束します。

$$\mu\left(\bigcup_{j=1}^{\infty}A_j\right)=\lim_{j\rightarrow\infty}\mu(A_j)$$

ある人の居住地を最も小さな単位で表すと、「5階1号室に住んでいます」などとなります。1段階大きなくくりでは「〇〇マンションに住んでいます」、くくりを少しずつ大きくしてゆくと「△△市に住んでいます」「××県に住んでいます」「日本国に住んでいます」「地球に住んでいます」…となります。最後の一番大きなくくりにそれまでのくくりすべてが含まれています。単調増加とはこういう状況です。

単調増加な集合列と対をなすのが単調減少な集合列です。これは、要素がどんどん小さくなる、つまりすべての $j$ について$A_{j+1}\subset A_j$であるような集合列です。この積の測度は最後の、つまり最小の要素の測度に収束します。

$$\mu\left(\bigcap_{j=1}^{\infty}A_j\right)=\lim_{j\rightarrow\infty}\mu(A_j)$$

ただし、$\mu(A_1)$は有限とします（最小の要素の測度になるのだから、この条件は不要にみえますが、証明の過程で必要となります）。この式は上式とよく似ていますが、上式は和$\bigcup$、この式は積$\bigcap$であることに注意しましょう。

玉ねぎ🧅を横で輪切りにすると同心円状にリングが重なっていますよね。リングを外側から1枚ずつ取り除いてゆくと、最後に一番小さな真ん中だけが残ります。単調減少とはそんなイメージです。

2024年5月7日

空集合、全体集合、零集合、補集合、和集合、積集合の可測性（Lebesgue Measure）

* * *

前回の記事で測度を定義しました。今回はそのつづきです。集合$X$の様々な部分集合と要素の可測性を調べます。

空集合と全体集合

空集合$\varnothing$と全体集合$X$は可測です。これは、可測性の定義式にこれらを代入してすぐ確かめられます。

$$\mu(E\cap \varnothing)+\mu(E-\varnothing)=\mu(\varnothing)+\mu(E)=\mu(E)$$

$$\mu(E\cap X)+\mu(E-X)=\mu(E)+\mu(\varnothing)=\mu(E)$$

零集合

最小の測度を持つ要素、もしくはその集まりを零集合（null set）といいます。零集合の可測性を調べてみましょう。

$$\mu(E\cap A)+\mu(E-A)\leq\mu(A)+\mu(E)=\mu(E)$$

第1項は最小の測度を持つ零集合と任意の集合の積が零集合であることから、第2項は集合から集合を引いた結果がもとの集合以下であることから、このように変形できます。最右の等式は$\mu(A)=0$（最小の測度は0というのが測度の基本性質）であることから得られます。上式の最左と最右に注目すると

$$\mu(E\cap A)+\mu(E-A)\leq\mu(E)$$

これは、前回紹介した可測性の弱い条件ですので、可測性が確認できました。空集合も零集合ですので可測です。

補集合

集合$X$の部分集合$A$に対して、$A$ではないものを補集合といい、$A^c$と表記します。いわゆる、ではないほうが補集合です。$A$が可測であるとき、$A^c$の可測性を調べましょう。

$$\mu(E\cap A^c)+\mu(E-A^c)=\mu(E-A)+\mu(E\cap A)$$

第1項は「ではないほうと重なる」と「であるほうを除く」が同じであることから、第2項は「ではないほうを除く」と「であるほうと重なる」が同じであることから、このように変形できます。右辺の第1項と第2項を入れ替えると

$$\mu(E\cap A)+\mu(E-A)$$

これはとりもなおさず可測性の定義式です。

$$\mu(E)=\mu(E\cap A)+\mu(E-A)$$

右辺の各項を補集合の表記に戻せば、補集合の可測性が確認できます。

$$\mu(E)=\mu(E\cap A^c)+\mu(E-A^c)$$

和集合と積集合

集合$X$の部分集合$A, B$の和集合とは、集合$A$または$B$に入る要素すべての集まりであり、$A\cup B$と表記します。積集合とは、集合$A$と$B$の両方に入る要素すべての集まりであり、$A\cap B$と表記します。和集合はまたは、積集合はかつですので

$$A\cap B\subset A\cup B$$

となります。可測である集合$A$と$B$の和集合の可測性を調べましょう。可測性の定義式は

$$\mu(E)=\mu(E\cap A)+\mu(E-A)$$

$B$が可測であることを用いて$\mu(E-A)$を測ると

$$\mu(E-A)=\mu((E-A)\cap B)+\mu((E-A)-B)$$

これを上式の右辺第2項に代入すると

$$\mu(E)=\mu(E\cap A)+\mu((E-A)\cap B)+\mu((E-A)-B)$$

右辺第3項の形を少し変えると、項の中に和集合が現れます。

$$\mu(E)=\mu(E\cap A)+\mu((E-A)\cap B)+\mu(E-(A\cup B))$$

この式を式(*)とおきましょう。右辺の第1項と第2項は、和集合の可測性の定義式の第1項 $\mu(E\cap (A\cup B))$と何らか比べられるべきです。少しトリッキーですが、この集合を次のように変形します。

$$E\cap (A\cup B)=(E\cap A)\cup(E\cap B)$$

$$\qquad\qquad\qquad\qquad=(E\cap A)\cup((E-A)\cap B)$$

劣加法性から

$$\mu(E\cap (A\cup B))=\mu((E\cap A)\cup((E-A)\cap B))$$

$$\qquad\qquad\qquad\quad\leq\mu(E\cap A)+\mu((E-A)\cap B)$$

これは、この式の最左辺が、式(*)の右辺第1項と第2項の和より小さいことを意味します。式(*)の右辺第1項と第2項が最右辺であれば等式が成立しますから、それより小さい左辺を代入すれば、関係は$\geq$になります。すなわち

$$\mu(E)\geq\mu(E\cap(A\cup B))+\mu(E-(A\cup B))$$

この式は、可測集合$A, B$の和集合が可測であることの定義式です。

さいごに、可測集合$A, B$の積集合の可測性を調べましょう。補集合と和集合はすでに可測であることが確かめられていますので、次のような変形から可測であることが示されます。

$$(A^c\cup B^c)^c=A\cap B$$

私たちがよくみかける集合について、可測性が確認できました。

ジョルダン、ルベーグ、カラテオドリ（Lebesgue Measure）

* * *

前回までで、距離空間のシリーズをひとまず終えました。次のテーマとして測度とベクトル空間を候補にしたのですが、まずは測るということの理解を深めたいと思い、ルベーグ測度のシリーズにしました。

ルベーグ測度：測る
ベクトル空間：計算する

* * *

私たちは、日常生活の中でいろいろなものを測っています。距離を測ったり、面積や体積を測ったり、重さを測ったり、個数を測ったり、気温を測ったり、高度を測ったり、濃度を測ったり、照度を測ったり、彩度を測ったり、比率を測ったり、確率を測ったりします。こうしたことができるのは、測りかたのルールがきちんと定まっているためです。

フランス人のルベーグ（Henri Léon Lebesgue：1875-1941）という人は、測りかたを深く探究した数学者です。1789年大革命でメートル法を提唱したフランスの伝統は、この人の理論に息づいているのでしょう。

こちらの記事によれば、メートル法以前には800とおりもの測りかたがあったようです…

https://www.nikkei.com/article/DGXMZO68183680V10C21A1000000/

* * *

内測度と外測度

入り組んだ形をした敷地の面積を近似することを考えます。

まず、敷地の境界にかからないように有限個のタイルを敷地内側に敷き詰め、そのタイルの面積の総和で敷地面積を近似する方法があります。これを内測度（inner measure）といいます。もうひとつ、敷地の境界にほんのわずかだけかかるように有限個のタイルを敷き詰め、そのタイルの面積の総和で敷地の面積を近似する方法があります。これを外測度（exterior measure, outer measure）といいます。

内測度の上限と外測度の下限が等しいことを可測（measurable）といいます。

ジョルダンの測度

敷き詰めるタイルが大きいとき、内測度は外測度より小さくなります。1m四方のタイルは、曲線を描く敷地にピッタリ敷き詰められず、隙間ができます。これを敷地境界にかかるように敷き詰めると、大きくはみ出します。

敷地へのフィット感を高めるために、タイルを50cm四方、10cm四方、5cm四方、1cm四方、…とどんどん小さくしてみましょう。とてつもなく変な形をした敷地でない限り、あるところで内測度の上限と外測度の下限が一致します。この可測な敷地の面積をジョルダン測度（Jordan measure）といいます。

ルベーグの測度

ジョルダンは、敷地に有限個のタイルを敷き詰めることを考えました。この考えを拡張して、敷地に可算無限個のタイルを敷き詰めることを考えたのがルベーグです。

敷き詰めるタイルの枚数を可算無限個へ拡張すると、ジョルダン不可測な敷地の面積も測れるようになります。ここでは、1m四方の正方形から、縦横ともに有理数の値をもつ可算無限個の点（有理点）をすべて除いた図形を例にします（志賀浩二『ルベーグ積分30講』p.41, 図13）。極小・無数の穴が空いた1m四方のメッシュのイメージです。

ジョルダンの方法にはタイルが有限個しかありませんので、可算無限個の穴すべてをカバーできません。ルベーグの方法にはタイルが可算無限個用意されていますので、穴すべてをカバーできます。極小のタイルでカバーした穴それぞれの面積を0とみると、それを可算無限個足し合わせた面積も0になります。すると、このとてつもなく変な形をした敷地の面積は1平方メートルと0の差、1平方メートルとなります。

$$外側から測った正方形の面積-可算無限個の穴の面積総計$$

$$=1-0=1$$

* * *

ルベーグの考えをまとめましょう。 $j(.), m_*(.), m^*(.)$をそれぞれ、ジョルダン測度、ルベーグ内測度、ルベーグ外測度とします。このとき集合$A$のルベーグ内測度$m_*(A)$は、ジョルダン可測な大枠$E$と、$E$から$A$を除いた部分（$E-A$の外測度）の差となります。すなわち

$$m_*(A)=j(E)-m^*(E-A)$$

集合$A$の中心部からきわへ向かって外測度の上限をとり、$A$の外側を塗りつぶすと$A$が浮かび上がるイメージです。ルベーグ可測であるとき、内測度と外測度は等しくなります。よって

$$m^*(A)=j(E)-m^*(E-A)$$

* * *

カラテオドリの可測

上式の右辺にある$m^*(E-A)$を移項して、左右入れ替えると

$$j(E)=m^*(A)+m^*(E-A)$$

$A$が可測であるとき$j(E)=m^*(E)$であり、また$A$が$E$の部分集合であることに注目すると$m^*(A)=m^*(E\cap A)$が成り立ちます。これらを代入すると

$$m^*(E)=m^*(E\cap A)+m^*(E-A)$$

ルベーグの外測度$m^*(.)$を$\mu(.)$に置き換えると

$$\mu(E)=\mu(E\cap A)+\mu(E-A)$$

すべての$E$についてこの式が成り立つとき、$A$は可測であるといいます。このように表現するのは、もともと$A$の可測性を示す式を変形して得られた式であるためです。上式は次のようにも書けます。$A^c$の可測性については次回説明します。

$$\mu(E)=\mu(E\cap A)+\mu(E\cap A^c)$$

この式は、$A$に含まれるものと含まれないものに$E$を二分して測った測度の和が、$E$の測度に等しいことを示しています。距離空間でもデデキントの定理、ベールのカテゴリー定理、可分性など全体を二分する話が出てきました。数学では「これとこれ以外」という分けかたが認識の基礎になっているようです。この可測の条件は、ルベーグと同じ世代のギリシャ人数学者、カラテオドリ（Constantin Carathéodory）が提示しました。それで、カラテオドリの条件といいます。

* * *

カラテオドリ測度の性質

カラテオドリの外測度（exterior measure, outer measure）には次のような性質があります。

$0\leq\mu(A)\leq\infty$
$\mu(\varnothing)=0$
$A\subset E \implies \mu(A)\leq\mu(E)$
$A\subset\bigcup_{j=1}^{\infty}A_j \implies \mu(A)\leq\sum_{j=1}^{\infty}A_j$

記号ばかりですので説明を加えます。まず1ですが、測度はマイナスの値をとりませんが、無限大まで大きな値はとりうるということです。

つづいて2ですが、これは空集合$\varnothing$を測った値を0とするということです。空集合とは、何も載っていないお皿🍽️のイメージです。お皿に何か載っている🍛のであれば、カロリーを測ったり、重さを測ったり、大きさを測ったりできますが、何も載っていなければ測りようがありません。そうしたものの値は0にするということです。条件1で測度の下限を0にしましたが、これは空集合の測度を0と定義することによります。

3は単調性（monotonicity）といわれる性質です。より大きなものにより大きな値を与えるという測度の性質です。たとえば、東京都より日本国のほうが大きいので、東京都の面積より日本国の面積のほうが広いと評価するということです。もし「東京都の面積より日本国の面積のほうが狭いです」と言われると、私たちは「えっ？」となってしまいます。「他も含めた敷地の面積はもとの敷地の面積より広くなる」という、私たちの常識的な感覚と合う測度の性質が単調性です。

4は劣加法性（subadditivity）といわれる特徴です。外測度を測るとき、敷き詰めるタイルが重なっていても構いません。また、境界にかかるようにタイルを敷き詰めます。それで、敷き詰めたタイルそれぞれの面積の合計は敷地面積以上になります。距離空間には三角不等式がありました。これは、ゴールに真っ直ぐ突き進むより、どこかに立ち寄ったほうが距離は長くなるという性質です。この特徴を、より一般的な測度の世界でも保つということです。

条件4を用いると、可測の条件を弱く表現できます。

$$\mu(E)\geq\mu(E\cap A)+\mu(E\cap A^c)$$

なぜかというと、逆向きの不等式（$\leq$）は条件4そのものだからです。

* * *

一般的理論に還元されてしまうと、数学は内容のない単なる美しい形式になってしまう。そしてそれはすぐに死にたえてしまう

（ルベーグの言葉を引用したメルツバッハ＝ボイヤー『数学の歴史』からの引用を引用した志賀浩二『ルベーグ積分30講』数学30講シリーズ, 9, 朝倉書店, 1991, p.38）

2024年5月5日

距離空間の可分性（Metric Space）

* * *

距離空間$(X, d)$において、可算・稠密な部分集合があることを可分（separable）といいます。たとえば、実数には可算・稠密な有理数という部分集合がありますので、可分です（ベールのカテゴリー定理）。言い換えると、下式のように、部分集合の閉包（部分集合とその導集合の和）が全体集合になっているとき、可分といいます。

$$\mathbb{R}=\overline{\mathbb{Q}}=\mathbb{Q}\cup\mathbb{Q}^d$$

p-ユークリッド空間

$N$次元の実数$\mathbb{R}$の距離空間$(\mathbb{R}^N, d)$の可分性について考えます。ここで距離の測りかた$d_p$を次のように定義します。

$$d_p=\left(\sum_{n=1}^N|x_n-y_n|^p\right)^{1/p}$$

ここで、$p$は1以上の有限な実数です。$p$の値が無限大であるときには、各要素どうしの距離のうち最長のものを距離とします。

$$d_{\infty}=\left(\sum_{n=1}^N|x_n-y_n|^{\infty}\right)^{1/{\infty}}=\max_{1\leq n\leq N}|x_n-y_n|$$

$d_{\infty}$が$\max$関数になるのは、絶対値で測った最長の距離を無限大乗した値は、他の小さな値の無限大乗を圧倒（dominate）するためです。最長の距離以外のものは視界から消えるということです。

これらの距離空間はいずれも可分です。なぜかというと、実数は有理数 $\mathbb{Q}$と無理数（有理数の集積点、つまり有理数$\mathbb{Q}$の導集合の要素）の和集合だからです。任意の実数$x$について

$$x\in\mathbb{Q}\cup\mathbb{Q}^d$$

右辺は閉包に等しいので

$$\mathbb{R}=\overline{\mathbb{Q}}$$

これは可分の定義そのものです。

$l^p$空間

数列（sequence of numbers）とは、数を並べたものです。似たものに点列がありますが、点列は空間に置かれた点の集まりです。1次元の点列が数列です。

次の条件を満たす実数からなる数列$\{\boldsymbol{x}_j\}_{j=1}^{\infty}$を$l^p$空間といいます。

$$\sum_{j=1}^{\infty}|x_j|^p<\infty$$

この空間での距離の測りかた $d$ を次のように定義します。

$$d_p(\{\boldsymbol{x}_j\}_{j=1}^{\infty}, \{\boldsymbol{y}_j\}_{j=1}^{\infty})=\left(\sum_{j=1}^{\infty}|x_j-y_j|^p\right)^{1/p}$$

この数列空間も、上と同様の議論から可分です。

$l^{\infty}$空間

$l^p$空間の$p$を無限大にしたものを$l^{\infty}$空間といいます。この空間での距離の測りかた $d$ を次のように定義します。

$$d_{\infty}(\{\boldsymbol{x}_j\}_{j=1}^{\infty}, \{\boldsymbol{y}_j\}_{j=1}^{\infty})=\sup_{j\in\mathbb{N}}|x_j-y_j|$$

$l^{\infty}$空間内の集合$E$は可算ではなく、稠密でもありません。したがって $l^{\infty}$空間は可分ではありません。この証明のラフ・スケッチは次のとおりです（現時点の私の理解の範囲内です）。

* * *

実数直線上の閉区間$[0, 1]$を例にとります。この区間内の数は複数の2進数展開で表すことができます。たとえば、0.5は

$$0.5=\frac{1}{2}+\sum_{j=2}^{\infty}\frac{0}{2^j}$$

と

$$0.5=\frac{0}{2}+\sum_{j=2}^{\infty}\frac{1}{2^j}$$

このことは、閉区間$[0, 1]$内の数を表す2進数展開の分子を数列に見立てたものの濃度は、閉区間$[0, 1]$の濃度以上であることを意味します。つまり

$$\aleph\leq|2進数展開の分子を数列に見立てたもの|$$

この不等式は、可分性の条件の1つである可算と矛盾します。

もう1つの条件は稠密ですが、これは集積点がとれるかどうかで判定します。閉区間$[0, 1]$から互いにごく近い2点$x, y$を取り出し、2進数展開します。$x$と$y$の値が異なるということは、2進数展開のいずれかの項の値が異なるということです。たとえば、第 $j$ 項の値だけが次のように異なるとしましょう。

$$xの第 j 項：\frac{1}{2^j}　　yの第 j 項：\frac{0}{2^j}$$

ここで分子だけ取り出すと1と0になります。したがって、$x, y$の距離を $l^{\infty}$で測ると、絶対値ですから1になります。この1は孤立点となり、集積点になりえません。これは、$x, y$を表す2進数展開の数列の$l^{\infty}$距離が稠密でないことを意味します。

可分の条件である可算も稠密も満たさないことから、数列空間$l^{\infty}$は可分ではないことがわかりました。

* * *

証明の詳細はとても難しいです。また理解が進んだら戻ってきて、よりよい形になるよう加筆・修正したいと思います。

2024年5月4日

集合の直径、集合と集合の距離、集合と点の距離（Metric Space）

* * *

2点間の距離を応用すれば、点と集合の距離や集合と集合の距離も測れそうです。また、集合の幅のようなもの（集合の直径）も測れそうです。今回は、これらの測りかたを紹介します。以下はすべて距離空間 $(X, d)$についての話であり、$x$は$X$の要素、$A, B, E$は$X$の非空な部分集合とします。

点と集合の距離

まず、点と集合（要素の集まり）の距離を考えましょう。直感的には、点と集合内の各要素の距離のうち、最も短いものが点と集合の距離になりそうです。日常会話で「コンビニまでの距離」と言うとき、最寄りのコンビニまでの距離ですよね。距離空間では、この直感どおりに点と集合の距離を定義します。点$x^*$と集合$E$の距離は

$$d(x^*, E)=\inf\{d(x^*, x)|x\in E\}$$

$\inf$は下限です。高校のとき、点と線の距離という単元がありました。あのとき、点から線に向かって垂線（直角に交わる線）を引いたのは、点から線という集合への最短距離を測るためでした。

$x^*$が集合$E$の内点または境界点であるとき、点と集合の距離は0です。

集合と集合の距離

つづいて、集合と集合の距離を測りましょう。距離空間では、集合$A$と集合$B$の距離を次のように測ります。

$$d(A , B)=\inf\{d(a, b)|a\in A, b\in B\}$$

これも、最寄りの距離です。コンビニとドラッグストアの距離というとき、コンビニの隣にドラックストアが立地していれば、その距離を測りましょうということです。これも直感に合います。わざわざ目の前のコンビニと隣町のドラッグストアの距離を測らないですよね。

集合$A$と$B$に共通部分があるとき（$A\cap B\neq\varnothing$）、2つの集合の距離は0とします。商業施設の中にコンビニとドラッグストアが併設されているとき、どちらも商業施設内にあるという意味では、距離が0だと言えます。

集合の直径

集合の直径についても考えることができます。$X$の有界な部分集合$E$の直径（diameter）を、その要素$x_1, x_2$で表すと

$$diam(E)=\sup\{d(x_1, x_2)|x_1, x_2\in E\}$$

$\sup$は上限です。集合が楕円のような形をしているとき、長径（長い方の「直径」）を集合の直径とする、というイメージです。

$E$が1点集合（要素が１つだけ）であるとき、直径は0です。

ここまでの知識を用いると、集合と集合の距離、そして集合の直径の関係を表すことができます。2つの集合$A$と$B$について

$$diam(A\cup B)\leq diam(A)+diam(B)+d(A, B)$$

上でも書きましたが、$A$と$B$に共通部分があるとき$d(A, B)=0$になります。$A$と$B$に共通部分がないときには$d(A, B)>0$になります。

距離の写像の連続性

ここまで、点は動かないと仮定していました。点が連続に動くとき、点 $x$ と集合$E$の距離を次のような連続写像とみなすことができます。

$$f：X\rightarrow \mathbb{R}^+$$

ここで用いる連続の概念はリプシッツ連続です。すなわち、写像 $f$ は次の条件を満たします。

$$d(f(x_1), f(x_2))\leq K\cdot d(x_1, x_2)$$

この不等式が成り立つことを示しましょう。すべての$x\in E$について、点と集合の距離の定義から、次の不等式が成り立ちます。

$$d(x_1, E)\leq d(x_1, x)$$

これは、点$x_1$と集合$E$の距離は、2点$x_1$と$x$の距離のうち最短のものであるという、点と集合の距離の定義からわかります。つづいて、右辺に三角不等式を適用すると

$$d(x_1, E)\leq d(x_1, x)\leq d(x_1, x_2)+d(x_2, x)$$

真ん中の式を除いて、最左と最右の式に注目します。

$$d(x_1, E)\leq d(x_1, x_2)+d(x_2, x)$$

この式は任意の$x$について成り立ちます。$\inf d(x_2, x)=d(x_2, E)$であることに注意して、$d(x_2, x)$に$d(x_2, E)$を代入して左辺に移項すると

$$d(x_1, E)-d(x_2, E)\leq d(x_1, x_2)$$

$x_1$と$x_2$を入れ替えてもこの関係は成り立つので

$$d(x_2, E)-d(x_1, E)\leq d(x_2, x_1)$$

距離の定義から$d(x_1, x_2)=d(x_2, x_1)$が成り立つことに注意して、上の2式をまとめると

$$|d(x_1, E)-d(x_2, E)|\leq d(x_1, x_2)$$

左辺の絶対値は距離の尺度とみなせます。すなわち

$$d(f(x_1), f(x_2))=|d(x_1, E)-d(x_2, E)|$$

すると

$$d(f(x_1), f(x_2))=|d(x_1, E)-d(x_2, E)|\leq d(x_1, x_2)$$

ここで、すべての$\varepsilon>0$について$d(x_1, x_2)<\varepsilon$とすると

$$d(f(x_1), f(x_2))\leq d(x_1, x_2)<\varepsilon$$

$d(x_1, x_2)$は$\varepsilon$に上から抑えられ、$d(f(x_1), f(x_2))$は $d(x_1, x_2)$に上から抑えられることがわかりました。これは、リプシッツ連続の条件そのものです。

2024年5月1日

ユークリッド空間（Metric Space）

* * *

今回は、ユークリッド空間が距離空間であることを確認します。

コーシー＝シュワルツの不等式

準備として、まずコーシー＝シュワルツ（Cauchy-Schwarz）の不等式を紹介します。この不等式にはさまざまな相貌がありますが、ここで使うのに十分な次式を用います。

$$\left(\boldsymbol{ab}\right)^2\leq\boldsymbol{a}^2\boldsymbol{b}^2$$

ここで、$\boldsymbol{a}$ と $\boldsymbol{b}$ はともにベクトルです。この不等式が成り立つことを大まかにみましょう。以下、見やすくするために $a$ と $b$ は太字にしません。少しトリックめいていますが、実数 $t$ に関する式$(at+b)^2$を作り、展開してみます。

$$(at+b)^2=a^2t^2+2abt+b^2$$

左辺は実数を2乗していますので非負です。また、$a\neq 0$であるとき、下に凸な2次関数になります。これらのことに注意して判別式を書くと

$$D=(2ab)^2-4a^2b^2\leq 0$$

$$(ab)^2\leq a^2b^2$$

不等式が得られました。$a=0$であるときも、この式は等式として成り立ちます。

ユークリッド空間

幾何的な分析に有用な距離空間を、古代ギリシャの幾何学者ユークリッドにちなんでユークリッド空間（Euclidean space）といいます。この空間は、距離を測るために生成された$n$ 次元の実数空間$\mathbb{R}^n$です。

この空間内の距離の測りかたとしてひろく知られているのが、いわゆる2乗してルートをとる三平方の定理です。たとえば、座標平面上の原点と$P(1, 2)$の距離は

$$\sqrt{(1-0)^2+(2-0)^2}=\sqrt{5}$$

一般に、$\mathbb{R}^n$に置かれた2点$\boldsymbol{x}, \boldsymbol{x'}$の距離は

$$d=\sqrt{(x_1-x'_1)^2+(x_2-x'_2)^2+…+(x_n-x'_n)^2}$$

距離の定義

この測りかたが距離の定義を満たしていることを確認しましょう。以前の記事に書いた距離の定義を再掲します。

集合$X$から取り出した要素$x_1, x_2, x_3$の距離 $d$ が次の条件を満たすとき、これを距離空間という。

すべての $x_1, x_2$ について、$0\leq d(x_1, x_2)<\infty$
$x_1=x_2$ と $d(x_1, x_2)=0$ は同値である
$x_1\neq x_2$ であるとき $d(x_1, x_2)=d(x_2, x_1)$
$d(x_1, x_3)\leq d(x_1, x_2)+d(x_2, x_3)$

これらの条件を満たしているか、1つずつ確かめましょう。

まず1つめですが、$d$ に入る数はすべて実数であり、そのすべてを2乗して足していますので、負値は取り得ません。よって$d$ は非負です。$d$ の値が無限に発散しないためには有界性を示さなければなりませんが、私の能力を超えます。ただ、無限の距離を持つものは、そもそも考慮の対象外とするのが自然です。

2つめは、同じ座標に置かれた2点の距離は0であり、距離が0であれば2点は同じ座標に置かれているということです。座標平面に置かれた2点 $P(1, 2)$と$Q(1, 2)$を例にしましょう。これら2点間の距離は、次のように0であることがわかります。

$$PQ=\sqrt{(1-1)^2+(2-2)^2}=0$$

この式の計算結果が0であるのは、ルートの中の各項の引き算の値がすべて0であるときだけです。そして、各項の引き算の値が0になるのは、各項の2つの数がまったく同じ値をとるときだけです。これは2点の座標がまったく同じであることを意味します。

3つめは、こちらからあちらへの距離と、あちらからこちらへの距離は同じであるということです。これはルートの中の各項が2乗されていることから明らかです。上でみた2点$O(0, 0)$と$P(1,2)$を例に式で確かめてみましょう。わざわざ式を書くまでもありませんが…

$$OP=\sqrt{(1-0)^2+(2-0)^2}=\sqrt{5}$$

$$PO=\sqrt{(0-1)^2+(0-2)^2}=\sqrt{5}$$

4つめはいわゆる三角不等式と呼ばれているものです。真っ直ぐゴールへ突き進む距離より、途中でどこかへ立ち寄る距離の方が長いという、これも単純明快なものです。上に掲げた不等式の左辺と右辺にユークリッド距離を代入してみましょう。

$$左辺=\sqrt{(x_1-x_3)^2}　　右辺=\sqrt{(x_1-x_2)^2}+\sqrt{(x_2-x_3)^2}$$

それぞれ2乗すると

$$左辺=(x_1-x_3)^2　　右辺=\left(\sqrt{(x_1-x_2)^2}+\sqrt{(x_2-x_3)^2}\right)^2$$

左辺を若干書き換えて展開すると

$$左辺=((x_1-x_2)+(x_2-x_3))^2=(x_1-x_2)^2+(x_2-x_3)^2+2(x_1-x_2)(x_2-x_3)$$

右辺を展開すると

$$右辺=(x_1-x_2)^2+(x_2-x_3)^2+2\sqrt{(x_1-x_2)^2}\sqrt{(x_2-x_3)^2}$$

左辺と右辺の違いは第3項だけです。よく見ると、左辺と右辺それぞれの第3項について、係数2を除いて2乗したものの比較はコーシー=シュワルツの不等式そのものです。すなわち

$$((x_1-x_2)(x_2-x_3))^2\leq(x_1-x_2)^2(x_2-x_3)^2$$

定義どおりに$左辺\leq 右辺$が示されました。2乗してルートをとる三平方の定理は距離空間の定義をすべて満たすことがわかりました。この測りかたをする距離空間をユークリッド空間といいます。

登録: 投稿 (Atom)