2024年5月27日

有限加法性、完全加法性、完備化(Probability Theory)

※私は数学者ではありません。自分用のまとめとしてこれを書いています。楽しむ範囲でご覧いただければ幸いです。内容の正確性については専門家のサイトや動画、あるいは専門書で必ず確認をお願いします。


*  *  *


「閉じている」について
「閉じている」という数学の用語があります。これは、ある集合から任意に取り出した要素に何らかの演算をほどこした結果も、もとの集合の要素であることを意味します。

たとえば、自然数$\mathbb{N}=\{1, 2, 3, …\}$は、足し算と掛け算で閉じています。自然数の集合から2と3を取り出し、足し算をすると

$$2+3=5$$

計算結果は5です。5は明らかに自然数です($5\in\mathbb{N}$)。自然数の集合から4と5を取り出し、掛け算をすると

$$4\times 5=20$$

計算結果は20です。20は明らかに自然数です($20\in\mathbb{N}$)。このように集合内の要素に演算をほどこした結果がもとの集合の要素であることを閉じているといいます。


有限加法性
有限個の和について閉じている集合の集まりを有限加法族といいます。フォーマルに表現すると、次の条件すべてを満たす集合族$\mathcal{F}$を有限加法族(finitely additive family)といいます。

  1. $\varnothing\in\mathcal{F}$
  2. $A\in\mathcal{F} \implies A^c\in\mathcal{F}$
  3. $\{\boldsymbol{A_j}\}_{j=1}^J\subset\mathcal{F} \implies \bigcup_{j=1}^{J}A_j\in\mathcal{F}$

前回例として挙げた$\mathcal{F}=\{\Omega, \varnothing, 表, 裏\}$は有限加法族です。まず、$\varnothing$が$\mathcal{F}$に属していますので、条件1を満たしています。つづいて、表の補集合である裏と$\varnothing$の補集合である$\Omega$がいずれも$\mathcal{F}$に属していますので、条件2を満たしています。さいごに、表と裏の和集合である{表, 裏}、すなわち$\Omega$も$\mathcal{F}$に属していますので、条件3を満たしています。よって、この例は有限加法族であることが確かめられました。

有限加法族上の測度を有限加法的測度といいます。有限加法的測度には次のような性質があります。$A, B$は$\mathcal{F}$の任意の要素とします。

  1. $0\leq m(A)\leq\infty$
  2. $m(\varnothing)=0$
  3. $A\cap B=\varnothing \implies m(A\cup B)=m(A)+m(B)$ 

性質3は、$\mathcal{F}$の任意の要素が互いに素であるとき、それらの和集合の測度は集合の測度の和に等しいことを表しています。これを有限加法性といいます。

用語は難しいのですが、コイントスの例を用いて説明すれば、表か裏が出る確率(=1)は、表が出る確率(0.5)と裏が出る確率(0.5)の和(=1)に等しいということです。サイコロを振って偶数の目が出る確率(0.5)は、2が出る確率(1/6)、4が出る確率(1/6)、6が出る確率(1/6)の和(=0.5)に等しいということです。

有限加法的測度は、確率が持つべき好ましい性質を持っています。


ホップの拡張定理
1回のコイントスや1回のサイコロ振りは、比較的単純な例です。より複雑な事象を分析するときには、有限個の要素からなる有限加法族を、可算無限個の要素からなる完全加法族(σ加法族)に拡張しておくと便利です。この拡張をしたのがホップ(E.F.F. Hopf:1902-1983)という人です。

彼が示したのは、有限加法的測度 $m$ が完全加法的であれば、$m$ を完全加法的測度 $\mu$ に拡張できる。

という定理です。現段階では、ある条件を満たせば、慣れ親しんだコイントスやサイコロ振りの考えを、複雑な事象の分析にそのまま適用できるという理解で十分だと思います。ホップの拡張定理をふまえると、$F$を実数として、その加法族上の確率を考えられるようになります。

この定理の詳細はとても難しいので、現段階ではこれだけにします。理解が深まりましたら、適宜加筆したいと思います。(伊藤清三『ルベーグ積分入門』pp.51-53、伊藤清『確率論の基礎』pp.50-54を参照。)


完全加法性
可算無限個の和について閉じている集合の集まりを完全加法族といいます。フォーマルに表現すると、次の条件すべてを満たす集合族(集合の集まり)$\mathcal{F}$を完全加法族(σ加法族:completely additive family, σ-fieldといいます。(伊藤清三『ルベーグ積分入門』pp.29-30を参照。ただし、伊藤清『確率論の基礎』pp.1-2では、条件1は空集合ではなく全体集合となっている。空集合が$\mathcal{F}$に含まれることは、余事象の条件から導かれている。)

  1. $\varnothing\in\mathcal{F}$
  2. $A\in\mathcal{F} \implies A^c\in\mathcal{F}$
  3. $\{\boldsymbol{A}_j\}\subset\mathcal{F} \implies \bigcup_{j=1}^{\infty}A_j\in\mathcal{F}$

この完全加法族上の測度を完全加法的測度といいます(伊藤清『確率論の基礎』pp.2-3)。完全加法的測度 $\mu$は次の性質を満たします。$A$と $A_j, A_k, j\neq k$は$\mathcal{F}$の任意の要素とします。

  1. $0\leq \mu(A)\leq\infty$
  2. $\mu(\varnothing)=0$
  3. $A_j\cap A_k=\varnothing  \implies \mu(\sum_{j=1}^{\infty}A_j)=\sum_{j=1}^{\infty}\mu(A_j)$ 

このように拡張された完全加法的測度を用いれば、正規分布のように、実数全体に定義域が広がる分布の確率も測れるようになります。


測度の完備化
ここまでで、確率測度を完全に定義できたように思えますが、あともう一歩が必要です。それが零集合を組み込む作業です。これまで、$\mathcal{F}$の要素としての零集合を気にしてきませんでした。ここでは零集合を含む完全加法族を考えます。すなわち

$$\mathcal{F}^*=\mathcal{F}\cup N$$

ここで$N$は零集合です。零集合とは、もとの集合の要素のうち、分析の考慮外とする要素の集まりのことです。つりがね状の形をした標準正規分布を例にすると、この分布から任意に取り出した1点、0とか0.1とか $\sqrt{2}$、の確率は0です。なぜかというと点の測度(長さ)は0だからです。実数上には無数の点がひしめいています。それらの測度はすべて0ですので、それらすべては零集合の要素になります。零集合にはこうしたややこしいものすべてを吸い込む魔力があります。

伊藤清『確率論の基礎』pp.10-11では、サイコロの例が紹介され、実数全体から特定の数字を除いた、とてつもなく大きな集合を零集合としています。零集合は、はじめて学ぶ私たちには窺い知れない何かのようです。測度空間の完備化について、フォーマルな説明は伊藤清三『ルベーグ積分入門』pp.43-48を参照してください。

標準正規分布のグラフをみると、0とか0.1とか$\sqrt{2}$のところは横軸上の線にならず、0より大きい曲線上の値をとっています。「それなのに測度0なのはおかしい」と思われるかもしれません。これは、ルベーグ積分の記事で説明していますが、関数を単関数近似してできる短冊の縦の長さ(確率論の文脈では確率密度)は確かに0ではなく正の値を持ちますが、横の長さが測度0であるため、掛け算をした結果が0になることを意味します。つまり

$$短冊の縦の長さ\times 0(横の長さ:零集合の測度)=0$$

横の長さが0なので、縦の長さ(確率密度)がどんな正の値をとっても掛け算の結果は0になります。横の長さが点ではなく、わずかでも長さを持つ線分になると、測度は正の値をとります。よって掛け算の結果も正の値をとります。短冊の横を、点でも線分でも直線でも、もとの集合$\Omega$の要素であれば、なんでも評価できるようにする作業を完備化といいます。

もうひとつ、$-\infty$と$+\infty$の測度も0とすることで、実数と$\pm\infty$をベースとした完全加法族についても測度を測ることができるようになります。


*  *  *


零集合を含まない$\{\Omega, \mathcal{F}, \mu\}$の$\mu$を、完備でないボレル集合族上のルベーグ測度、零集合を含む$\{\Omega, \mathcal{F}^*, P\}$の$P$を、ルベーグ可測集合族上のルベーグ測度といいます。(原啓介『測度・確率・ルベーグ積分』講談社, 2018, p.29)

有限加法的測度から完全加法的測度へ、完全加法的測度からルベーグ測度へと少しずつ拡張することによって確率を議論する土壌が整いました。


2024年5月26日

確率とは(Probability Theory)

※私は数学者ではありません。自分用のまとめとしてこれを書いています。楽しむ範囲でご覧いただければ幸いです。内容の正確性については専門家のサイトや動画、あるいは専門書で必ず確認をお願いします。


*  *  *


「コインを投げて表が出る確率は2分の1」とか「サイコロを振って3が出る確率は6分の1」くらいが私たちの多くにとっての確率です。それで「確率なんて簡単!、高校でもちょっとやったし」と思いがちです。

ただ、数学的には、これまで書いてきた集合論、測度論、そのほかたくさんの土台となる知識があってはじめて論じられる話題のようです。その意味では、現段階でこのトピックを取り扱うのは無謀極まりないのですが、文系による個人ブログということで大目にみていただければ幸いです。(文系を免罪符にしてはいけませんが…)


*  *  *


ラプラスの確率
「10回くじを引けば1回当たりが出る」とか「2回コイントスをすれば1回表が出る」というのは、同様に確からしい試行を繰り返して何回成功するかというある種の相対頻度です。

数学者・天文学者のラプラス(Pierre-Simon Laplace:1749-1827)は確率というものをおおよそこのように考えました。素朴とも言えますが私たちの多くにとって自然に感じられる考え方です。

参考資料


未解明の生起メカニズムをブラックボックスとして、その結果だけを問題にすると、偶然の要素が作用したようにみえます。その作用を相対頻度で数値化したものが古典的な意味での確率です。

ラプラスが生きた18世紀の中頃から19世紀のはじめは近代科学の黎明期でした。当時は、各学問領域に仮置きされているブラックボックスの中身が解明されれば確率の意義は薄れてゆくと考えられていました。そうした科学にとって希望に満ちた時代を象徴するのがラプラスの悪魔という言葉です。

ラプラスが『確率の解析的理論』の中に書き記したことに尾ひれがついてひろまったこの言葉の意味は、すべてのブラックボックスが解明されれば、確率的にみえることが実は確定的であることがわかり、世界の全てがわかるはずだということです。

面白いことに、科学が発展して起きたのは、確率の意味が薄れることではなく、確率の意義が高まることでした。高まる意義に応えるべく確率概念を定式化したのがコルモゴロフ(1903-1987)です。


コルモゴロフの確率
コルモゴロフが定式化した確率論は、数学的な道具で記述されます。皮肉なことに、これが私たちを確率論から遠ざけることにもなりました。確率論のテキストのはじめに$(\Omega, \mathcal{F}, P)$という表記が登場します。この記号を見た大半の人は、「確率論は難しすぎる」と学びをやめてしまいます。私も長らくこれが何かわかりませんでした。現時点での理解ですが、$(\Omega, \mathcal{F}, P)$はおおよそ次のような意味を持つようです。

$\Omega$:「オメガ」と読むこれは、起こりうるすべてのことを集めたものです。たとえば、コイントスをすると表か裏が出ます。「表が出る」とか「裏が出る」ということは、それ以上細かく場合分けできません。そうしたものを根元事象(elementary event)標本(sample)といいます。そして、根元事象をすべて集めたものを全事象(sure event)といいます。

$\mathcal{F}$:これは加法族といわれるものです。加法族とは、$\Omega$をベースにした全事象、余事象、和事象を含む集合の集まりのことです。コイントスの例を用いると、全事象とは

$$\Omega=\{表, 裏\}$$

です。余事象とはではないほうのことです。たとえば、全事象$\Omega$の余事象は

$$\Omega^c=\varnothing$$

です。$\Omega$の右上にある$c$は、余事象(complementary event)を表すマークです。$\varnothing$は空集合です。コイントスをして表か裏が出ることを全事象としたとき、その余事象はコイントスをして表も裏も出ない、つまり何も起きないということです。何も起きないことを記号$\varnothing$で表します。同様に、「表が出る」の余事象は「裏が出る」であり、「裏が出る」の余事象は「表が出る」です。

和事象とは、2つ以上の根元事象のいずれかが起きることを意味します。「表が出る」と「裏が出る」という2つの根元事象の和は

$$表\cup 裏$$

と表記します。$\cup$は事象の和を表します。全事象、余事象、和事象すべてを含む集合の集まりは

$$\{\Omega, \varnothing, 表, 裏, \{表, 裏\}\}$$

この例では$\Omega= \{表, 裏\}$ですので、これを$\Omega$で代表させると

$$\mathcal{F}=\{\Omega, \varnothing, 表, 裏\}$$

$\mathcal{F}$の要素は4つです。要素が有限個であることから、これを有限加法族といいます。一般に、有限加法族の要素の数は2の根元事象乗($2^{\Omega}$)だけあります。この例では根元事象は2つですので、有限加法族の要素の数は$2^2=4$個です。

$P$:これは$\mathcal{F}$の要素すべてに付される確率を意味します。すべての事象に付けられた値だと考えてください。コイントスの例では

$$P(\Omega)=1, P(\varnothing)=0, P(表)=\frac{1}{2}, P(裏)=\frac{1}{2}$$

全事象$\Omega$の確率を1とすると、それ以外の事象の確率を直感的に掴みやすくなります。全体を1(100%)とすることで、確率20%とか60%とか、わかりやすく確率を評価できます。何かが起こる確率が100%なのであれば、何も起きない確率は0です。これが$P(\varnothing)=0$という表記です。

また、根元事象は互いに素ですので、根元事象の和事象の確率は各根元事象の確率の和に等しくなります。ここに加法族の加法の意味があります。すなわち

$$P(表\cup 裏)=P(表)+P(裏)=\frac{1}{2}+\frac{1}{2}$$

すべての根元事象の和事象の確率は1になります。この例の根元事象は「表が出る」と「裏が出る」の2つですので、これら2つの和事象の確率は1になります。確認のために式を書くと

$$P(表\cup 裏)=P(\Omega)=1$$

私たちが日常使う「確率」という言葉を、数学ではここまで細かく定義します。また少しずつ確率のはなしを書いてゆければと思います。


2024年5月20日

単調収束と優収束の定理(Lebesgue Measure)

※私は数学者ではありません。自分用のまとめとしてこれを書いています。楽しむ範囲でご覧いただければ幸いです。内容の正確性については専門家のサイトや動画、あるいは専門書で必ず確認をお願いします。


*  *  *


数学者でない私たちにとっての測度のはなしは、終わりに近づいてきました。今回は単調収束定理と優収束定理を紹介します。


単調収束定理
ボレル集合$\mathcal{B}$の部分集合$E$上の可測な非負関数$f$を考えます。この関数の増加列$0\leq f_1\leq f_2\leq f_3, …$が$f$に収束するとき、次式が成り立つことを単調収束定理(monotone convergence theorem)といいます。

$$\int_{E}fd\mu =\lim_{j\rightarrow\infty}\int_{E}f_jd\mu$$

この定理はおおよそ次のように確かめられます。まず、関数列が単調増加で収束することから、任意の$f_j$の値は収束先以下となります。すなわち

$$f_j\leq f$$

となります。測度の単調性から、両辺を$E$の範囲でルベーグ積分しても不等号が保たれます。

$$\int_E f_j d\mu\leq \int_E f d\mu$$

さらに、$\lim_{j\rightarrow\infty}\sup f_j=f$より、左辺の上極限をとっても不等号が保たれます。

$$\lim_{j\rightarrow\infty}\sup\int_E f_j d\mu\leq \int_E f d\mu$$

ファトゥの補題から

$$\lim_{j\rightarrow\infty}\inf\int_E f_j d\mu\geq \int_E f d\mu$$

$\lim\inf\leq\lim\sup$に注意して2式をまとめると

$$\int_E f d\mu\leq\lim_{j\rightarrow\infty}\inf\int_E f_j d\mu\leq\lim_{j\rightarrow\infty}\sup\int_E f_j d\mu\leq \int_E f d\mu$$

最左と最右ではさみうちされていることから、これらはすべて等号で結ばれます。関数列が収束するということは

$$\lim_{j\rightarrow\infty}\inf\int_E f_j d\mu =\lim_{j\rightarrow\infty}\sup\int_E f_j d\mu =\lim_{j\rightarrow\infty}\int_E f_j d\mu$$

よって

$$\int_E f d\mu=\lim_{j\rightarrow\infty}\int_{E}f_jd\mu$$


有界収束定理と優収束定理
関数列が単調増加でないとき、追加の条件がないと単調収束定理のような結論は得られません。具体的には、優関数という積分可能な関数で関数列が上から抑えられるという条件を加える必要があります。積分可能な優関数によって上から抑えられている関数列の任意の要素$f_j$とその各点収束先である$f$は、いずれも積分可能な可測関数となります。

少しフォーマルに書くと、ボレル集合$\mathcal{B}$の部分集合$E$上の関数列の任意の要素の絶対値が優関数の値($F$)以下であるとき、すなわち

$$|f_j|\leq F$$

であるとき

$$\int_{E}fd\mu =\lim_{j\rightarrow\infty}\int_{E}f_jd\mu$$

が成り立つ、というのが有界収束定理です。有界収束定理における上限は定数ですが、これを異なる値を取りうる$f$という関数に置き換えたものを優収束定理(dominated convergence theorem)、またはルベーグの収束定理といいます。これらはある種、有界な数列は収束するという数の世界の大原則を関数の世界に拡張したものです。

ただ、証明の詳細等については込み入ります。現段階ではtoo muchですので、また機会があれば加筆したいと思います。ルージンの定理、エゴロフの定理、フビニの定理(豆腐の体積の易しい求め方)、ラドン・ニコディムの定理(条件付期待値の定式化)なども、はじめて学ぶ私たちには荷が重すぎますね…


*  *  *


ほとんどいたるところ
測度論や確率論の本を読んでいると、ほとんどいたるところとか a.e. という表記をみかけます。これはalmost everywhereのことで、零集合を除いた測度が正の集合についてという意味です。ルベーグ積分では、関数の挙動が奇妙になるところを零集合に押し込み、それ以外のお行儀のよいところにだけ正の測度を与え、積分のベースにします。

リーマン積分との違いとして、リーマンは縦に切り、ルベーグは横に切るという、見た目の違いが強調されることが多いです。また、リーマン積分できない変な関数も積分できることが強調されることもあります。

こうした紹介は若干ミスリーディングに感じます。ルベーグは定義域の一部を零集合に押し込めるトリックを思いつき、このトリックによってより柔軟な測度の概念で積分を眺められるようになったことを強調すべきだと思います。これを、志賀浩二『ルベーグ積分30講』p.183は「リーマン積分からルベーグ積分への移行は、積分という観点に立ったとき、連続関数の '完備化' であったという見方もできるのである」と書いています。

高木貞治『解析概論』p.430は、「Lebesgueは一片の咒語 'ほとんど' をもって、彼の積分論に魅惑的な外観を与ええたのであった」と a.e. のことを評価しています。この一節は志賀浩二『ルベーグ積分30講』p.169にも引用されています。



2024年5月19日

単関数とルベーグ積分(Lebesgue Measure)

※私は数学者ではありません。自分用のまとめとしてこれを書いています。楽しむ範囲でご覧いただければ幸いです。内容の正確性については専門家のサイトや動画、あるいは専門書で必ず確認をお願いします。


*  *  *


複雑な形をしたグラフを近似するツールが単関数(simple function)です。これは、グラフを横棒で近似するものです。まずはこちらの図とかこちらの図をご覧ください。単関数のおおまかなイメージが持てると思います。

原啓介『測度・確率・ルベーグ積分』講談社 は多くの人が手に取る専門書です。このp.43に「ルベーグ積分を定義する戦略は、単関数に対して積分を定義しておいて、一般の関数については単関数による近似の極限で積分を定義することである」とあります。ルベーグ積分の導入のしかたにはさまざまあると思いますが、「なるほど、そうか!」と私の心に最も響いたのはこの一文でした。


*  *  *


単関数
では、単関数の定義域と値域を定義しましょう。次のように、互いに素な$J$個の部分集合に分割できる集合$E$を定義域とします。$E$は全体集合$X$の部分集合とします。

$$E=E_1\cup E_2\cup E_3\cup…\cup E_J$$

すべての$j\neq k$について$E_j\cap E_k=\varnothing$です。そして、次のような$J$個の値からなる集合を値域とします。

$$\{a_1, a_2, a_3, …, a_J\}$$

すべての $j$ について$a_j<a_{j+1}$であり、$0\leq a_j\leq\infty$とします。このとき、単関数とは

$$\phi(x)=a_1m(E_1)+a_2m(E_2)+a_3m(E_3)+…+a_Jm(E_J)$$

つまり

$$\phi(x)=\sum_{j=1}^J a_jm(E_j)$$

ここで、$m(E_j)$は$x\in E_j$のとき1、$x\notin E_j$のとき0をとる定義関数(indicator function)です。$\phi(x)$は$x\in E_j$であるときにだけ$a_j$の値をとり、$x\in E_k$であるときにだけ$a_k$の値をとります。つまり、$\phi$は定義域の部分と値域の値が対応する関数だということです。

このように定義される$\phi$は横棒が階段状につづくグラフになることから階段関数(step function)ともいいます。この不思議な関数を用いて、ルベーグは新たな積分(面積の求め方)を提案しました。


ルベーグ積分
ボレル集合族$\mathcal{B}$の部分集合$E$上の非負関数$f(E)$についてルベーグ積分を定義しましょう。

$$\int f d\mu=\lim_{J\rightarrow\infty}\sum_{j=1}^J a_j\mu(E_j)$$

左辺はルベーグ積分の記法であり、右辺は左辺の意味を表しています。右辺の$\mu$の中にある$E_j$は$E_j=f^{-1}(\{a_j\})$です。これは関数$f$の逆像です(引き戻し)。値域の値を$a_j$としたとき、その入力元となる定義域の値が$f^{-1}(\{a_j\})$です。私たちになじみのある言葉にすると「$x$の値」になります。

したがって、$\mu(f^{-1}(\{a_j\}))$は「$x$の値」の測度です。この測度を横の長さとして、縦の長さを対応する$a_j$としたとき、長方形ができます。この長方形の面積を各 $j$ について計算し、$J$個足し合わせるというのが $\sum$です。これにより「関数$f(x)$の下の面積」を、さまざまな高さと幅の長方形の面積の合計によって近似できます。

そして、値域の分割を限りなく細かくしてゆくと、「関数$f(x)$の下の面積」と無数の長方形の面積の合計がぴったり一致します。これが $\lim_{J\rightarrow\infty}$です。このように積分しよう、というのがルベーグ積分です。

定義域のうち、変なところを可測であるが測度0と評価することによって(正の測度を持つ部分集合と零集合に分割して)考慮外とし、お行儀のよいところだけ(正の測度を持つ部分集合だけ)値を与える($a_j$と掛け合わせる)ことで「お行儀のよい長方形」を作り、それを足し合わせて面積としようというのがルベーグの考えです。


*  *  *


全体を極小の部分に分割し、全体を鮮やかに再構成する作法はフランスの根底を流れる思想だと感じます。カトリック教会のステンドグラスを通じで床に降り注ぐ光は、まさに関数の逆像です。

ルベーグより少し早く生まれた経済学者のワルラス(1834-1910)は極小無数の消費者と生産者が出会う場としての市場を分析しました。また画家のスーラ(1859-1891)は、点描の技法を確立しました。1875年生まれのルベーグは、こうした知的空気感の中で着想を得たのかもしれません…


*  *  *


ルベーグ積分の存在
この積分が存在することは、関数$f(x)$を上下から単関数で挟み込むことによって確認できます。関数$f(x)$を上から抑える単関数を上積分といいます。上積分$\int^* f d\mu$は

$$\int^* f d\mu=\inf\left\{\int gd\mu | f\leq g すべての  x\in E\right\}$$

そして、下積分$\int_* f d\mu$は

$$\int_* f d\mu=\sup\left\{\int gd\mu | f\geq g すべての  x\in E\right\}$$

上2式の$\int gd\mu$は非負の値をとる単関数です。上積分=下積分のとき、ルベーグ積分の値が存在します。そして、その値が無限大に発散しないとき($\mathbb{R}_+$に収まるとき)、積分可能(可積分)といいます。


*  *  *


このような話をするために、測度、可測集合、可測関数、正則、σ加法族、ボレル集合など細かい道具立てをそろえる必要があります。ここまで来ると、「ああ、このためだったのか」という感じになるのではないでしょうか。ボレル集合を知るためには、位相の知識が必要ですね… また少しずつ学んでみたいと思います。


2024年5月18日

上極限と下極限(Lebesgue Measure)

 ※私は数学者ではありません。自分用のまとめとしてこれを書いています。楽しむ範囲でご覧いただければ幸いです。内容の正確性については専門家のサイトや動画、あるいは専門書で必ず確認をお願いします。


*  *  *


前回ファトゥの補題を概観したとき、上極限と下極限についておざなりにしてしまいました。この記事では、これらについて詳しくみます。

この記事は、以下のリンクを参照して作成しました。(理解の不十分さはすべて私の責任です。)


*  *  *


集合の積と和
複数の集合いずれにも入っている要素の集まりを集合のといいます。集合の記法を用いて表すと、2つの集合$A$と$B$の積は

$$A\cap B$$

抽象的でわかりにくいので、具体例を挙げます。$A$と$B$をそれぞれ次のようにおきます。

$$A=\{1, 2, 3, 4\}  B=\{3, 4, 5, 6\}$$

$A$と$B$いずれにも入っている要素を集めると

$$A\cap B=\{3, 4\}$$

複数の集合に共通する要素を抜き出していますので、積は共通部分ともいいます。これに対して、複数の集合のいずれかに入っている要素の集まりを集合のといいます。2つの集合$A$と$B$の和は次のように表記します。

$$A\cup B$$

$A$と$B$のいずれかに入っている要素を集めると

$$A\cup B=\{1, 2, 3, 4, 5, 6\}$$

となります。積を表す記号$\cap$はcap🧢とも読み、選ばれたものだけが入るイメージです。和を表す記号$\cup$はcup☕️とも読み、すべてが入るイメージです。


集合族の積と下極限
集合を並べたものを集合族といいます。たとえば、次のように集合を10個並べたものは集合族です。

$$\{A_1, A_2, A_3, …, A_{10}\}$$

ここでは、次の3つの集合からなる族を考えます。

$$A_1=\{3\}  A_2=\{3, 4\}  A_3=\{3, 4, 5\}$$

$A_1$は$A_2$に含まれ、$A_2$は$A_3$に含まれます。入れ子構造になっていますね。これを集合論の記法で書くと

$$A_1\subset A_2\subset A_3$$

となります。まずは$A_2$と$A_3$の積をみましょう。

$$A_2\cap A_3=\{3, 4\}$$

2つの集合のいずれにも入っているのは3と4です。5は$A_2$に含まれませんので、積集合の要素になりません。つづいて、$A_1$、$A_2$、$A_3$の積をみましょう。上で求めた$A_2\cap A_3$を用いると

$$A_1\cap(A_2\cap A_3)=\{3\}\cap\{3, 4\}=\{3\}$$

$A_1$と$A_2\cap A_3$のいずれにも入っているのは3だけです。4は$A_1$に含まれませんので、積集合の要素になりません。よって、3つの集合の積は

$$A_1\cap A_2\cap A_3=\{3\}$$

まとめると

式1 $A_1\cap A_2\cap A_3=\{3\}$
式2 $A_2\cap A_3=\{3, 4\}$
式3 $A_3=\{3, 4, 5\}$

集合3つのとき要素は1つ、集合2つのとき要素は2つ、集合1つのとき要素は3つです。興味深いことに、積をとる集合の数が減るにしたがい要素の個数は増えます。式1, 2, 3の和集合をとると

$$\{3\}\cup\{3, 4\}\cup\{3, 4, 5\}=\{3, 4, 5\}$$

これを集合の記法を用いておしゃれに書くと

$$\bigcup_{j=1}^3\bigcap_{k=j}^3 A_k=\{3, 4, 5\}$$

なぜこんなにコンパクトに書けるのか、確かめましょう。まず$j=1$のとき、$k$ は1から3まで1, 2, 3の値をとります。3つの集合の積をとりますので、式1になります。つづいて$j=2$のとき、$k$ は2から3まで2と3の値をとります。後ろ2つの集合の積をとりますので、式2になります。 $j=3$のとき、$k$ は3だけをとります。これは$A_3$そのものですので、式3となります。上式は式1, 2, 3の和集合ですので

$$\bigcup_{j=1}^3\bigcap_{k=j}^3 A_k=式1\cup 式2 \cup 式3$$
$$=\{3\}\cup\{3, 4\}\cup\{3, 4, 5\}=\{3, 4, 5\}$$

となり、表記法が正しいことがわかりました。ここでは集合が3つの例を考えましたが、集合族を集合列(可算無限個の集合を並べたもの)に拡張すると

$$\bigcup_{j=1}^{\infty}\bigcap_{k=j}^{\infty} A_k$$

この式の$\bigcap_{k=j}^{\infty}$は積をとることを意味しています。可算無限個ある集合のいずれにも入っている要素だけを取り出して作る集合は、ある種最小の集合とみることができます。解析の記法では、最小を下限($\inf$)と書きます。

$\bigcup_{j=1}^{\infty}$は、下限を求める作業を1つめの集合から、2つめの集合から、3つめの集合から、…と無限に繰り返すことを意味しています。解析の記法では、添字を無限に飛ばすことを極限($\lim$)といいます。よって、集合の記法は、次のように解析の記法に置き換えられます。

$$\bigcup_{j=1}^{\infty}\bigcap_{k=j}^{\infty} A_k=\lim_{j\rightarrow\infty}\inf A_j$$

$j=3$までの例では集合の要素が1つずつ増えていますが、$j$が100とか1000になると集合の要素は増えなくなり、そのまま変わらなくなるかもしれません。そのような行先の集合を下極限といいます。私たちが数列の下極限で持っていたイメージと比べて、かなり抽象度が高いですよね…


集合族の和と上極限
上のlim infと対照をなすのが、lim supです。先ほどと同じ3つの集合からなる族を例に考えます。

$$A_1=\{3\}  A_2=\{3, 4\}  A_3=\{3, 4, 5\}$$

まずは$A_2$と$A_3$の和をみましょう。和とは2つの集合のいずれかに入っている要素を集める作業ですので

$$A_2\cup A_3=\{3, 4, 5\}$$

この結果を用いて、$A_1$、$A_2$、$A_3$の和をとりましょう。

$$A_1\cup(A_2\cup A_3)=\{3\}\cup\{3, 4, 5\}=\{3, 4, 5\}$$

よって、3つの集合の和は

$$A_1\cup A_2\cup A_3=\{3, 4, 5\}$$

まとめると

式1 $A_1\cup A_2\cup A_3=\{3, 4, 5\}$
式2 $A_2\cup A_3=\{3, 4, 5\}$
式3 $A_3=\{3, 4, 5\}$

下極限のときとは異なり、$A$が3つのとき、2つのとき、$A_3$だけのとき、すべてについて要素は3つです。式1, 2, 3の積をとると

$$\{3, 4, 5\}\cap\{3, 4, 5\}\cap\{3, 4, 5\}=\{3, 4, 5\}$$

これを集合の記法を用いて書くと

$$\bigcap_{j=1}^3\bigcup_{k=j}^3 A_k=\{3, 4, 5\}$$

この表記についても確認してみます。まず$j=1$のとき、$k$ は1から3まで1, 2, 3の値をとります。3つの集合の和をとりますので、式1になります。つづいて$j=2$のとき、$k$ は2から3まで2と3の値をとります。後ろ2つの集合の和をとりますので、式2になります。$j=3$のとき、$k$ は3だけをとります。これは$A_3$そのものですので式3となります。上式は式1, 2, 3の積集合ですので

$$\bigcap_{j=1}^3\bigcup_{k=j}^3 A_k=式1\cap 式2 \cap 式3$$
$$=\{3, 4, 5\}\cap\{3, 4, 5\}\cap\{3, 4, 5\}=\{3, 4, 5\}$$

となります。集合族を集合列に拡張すると

$$\bigcap_{j=1}^{\infty}\bigcup_{k=j}^{\infty} A_k$$

この式の$\bigcup_{k=j}^{\infty}$は和をとることを意味しています。可算無限個ある集合のいずれかに入っている要素をくまなく取り出して作る集合は、最大の集合とみることができます。解析の記法では、最大を上限($\sup$)と書きます。

$\bigcap_{j=1}^{\infty}$は、上限を求める作業を1つめの集合から、2つめの集合から、3つめの集合から、…と無限に繰り返すことを意味しています。解析の記法では、添字を無限に飛ばすことを極限($\lim$)といいます。よって、集合の記法は、次のように解析の記法に置き換えられます。

$$\bigcap_{j=1}^{\infty}\bigcup_{k=j}^{\infty} A_k=\lim_{j\rightarrow\infty}\sup A_j$$

$j=3$までの数値例では、集合の要素が変わらないまま推移しています。もしこの状態が無限の先まで続くのであれば、これが集合の上極限になります。


下極限と上極限の関係
一般に、lim inf はlim supの部分集合です。

$$\lim_{j\rightarrow\infty}\inf A_j\subset\lim_{j\rightarrow\infty}\sup A_j$$

上に掲げた$J=3$の数値例では、lim infの集合とlim supの集合が一致します。$J$が無限大に向かうとき、lim infの集合とlim supの集合が一致するとき、それを極限集合(limit set)といいます。

$$\lim_{j\rightarrow\infty}\inf A_j=\lim_{j\rightarrow\infty}\sup A_j=\lim_{j\rightarrow\infty}A_j$$

極限は存在するときとしないときがありますが、上極限と下極限は必ず存在します($\pm\infty$を含めて考える場合)。それで、極限の有無を調べるツールとしてこれらの概念が使われます。


2024年5月13日

収束、上極限、下極限、ファトゥの補題(Lebesuge Measure)

※私は数学者ではありません。自分用のまとめとしてこれを書いています。楽しむ範囲でご覧いただければ幸いです。内容の正確性については専門家のサイトや動画、あるいは専門書で必ず確認をお願いします。


*  *  *


前回、σ加法族を紹介しました。今回はファトゥの補題を紹介します。これはとてつもなく難しいものですので、大まかなイメージを持てるところまでを目標にします。


収束と極限
数列の先のほうの値が変わらなくなるとき、収束する(converge)といいます。たとえば

$$2+\left(-\frac{1}{2}\right)^j$$

という数列を書き表すと

$$\left\{2+\left(-\frac{1}{2}\right)^1, 2+\left(-\frac{1}{2}\right)^2, 2+\left(-\frac{1}{2}\right)^3, …\right\}$$

この数列は、2を境に上下しながら限りなく2に近づいてゆきます。このとき、この数列は2に収束するといいます。数列には、収束せずに発散する(diverge)ものや振動したまま(oscillate)のものもありますがこの記事では有限な値に収束する数列について考えます。また、数列を集合に見立てた$A_j$はすべての $j$ について可測とします。


上極限と下極限
数列が収束するとき、その数列の一部を抜き出して作成した部分列も収束します。そのようすをみるものを上極限といいます。上の数列を例にしましょう。もとの数列は

$$\left\{2+\left(-\frac{1}{2}\right)^1, 2+\left(-\frac{1}{2}\right)^2, 2+\left(-\frac{1}{2}\right)^3, …\right\}$$

これは2に収束します。この数列から偶数番の要素だけ取り出すと

$$\left\{2+\left(-\frac{1}{2}\right)^2, 2+\left(-\frac{1}{2}\right)^4, 2+\left(-\frac{1}{2}\right)^6, …\right\}$$

これは最小上界(上限)が上から2に向かい収束します。この数列から4の倍数番の要素だけ取り出すと

$$\left\{2+\left(-\frac{1}{2}\right)^4, 2+\left(-\frac{1}{2}\right)^8, 2+\left(-\frac{1}{2}\right)^{12}, …\right\}$$

これも最小上界(上限)が上から2に向かい収束します。このように、もとの数列から作成した部分列の収束先は、もとの数列の収束先と同じことを確かめられます。これは、各部分列の最小上界(上限)を集めてその極限をとる作業ですので、次のように表記できます。

$$a^*=\lim_{j\rightarrow\infty}\sup A_j$$

同様に、減衰曲線の下からの収束をみるときには、各周期の極小値からなる部分列を作り、そのようすをみるのが賢明です。たとえば、奇数番だけ取り出すと

$$\left\{2+\left(-\frac{1}{2}\right)^1, 2+\left(-\frac{1}{2}\right)^3, 2+\left(-\frac{1}{2}\right)^5, …\right\}$$

これは最大下界(下限)が下から2に向かい収束します。各部分列の最大下界(下限)を集めてその極限をとる作業は、次式のように表記できます。$a_*$は下極限です。

$$a_*=\lim_{j\rightarrow\infty}\inf A_j$$

上極限と下極限が存在するとき、次の式が成り立ちます。

$$\lim_{j\rightarrow\infty}\inf A_j\leq\lim_{j\rightarrow\infty}\sup A_j$$

上極限$a^*$と下極限$a_*$が等しいとき、極限が存在するといいます。このとき、上の不等式は等号で成り立ちます。


集合の記法
集合の記法で上極限を表してみましょう。上の例を再び掲げると

$$A_1=\left\{2+\left(-\frac{1}{2}\right)^1, 2+\left(-\frac{1}{2}\right)^2, 2+\left(-\frac{1}{2}\right)^3, …\right\}$$
$$A_2=\left\{2+\left(-\frac{1}{2}\right)^2, 2+\left(-\frac{1}{2}\right)^4, 2+\left(-\frac{1}{2}\right)^6, …\right\}$$
$$A_3=\left\{2+\left(-\frac{1}{2}\right)^4, 2+\left(-\frac{1}{2}\right)^8, 2+\left(-\frac{1}{2}\right)^{12}, …\right\}$$

$A_1$の最小上界は$2+\left(-\frac{1}{2}\right)^2$、$A_2$の最小上界は$2+\left(-\frac{1}{2}\right)^2$、$A_3$の最小上界は$2+\left(-\frac{1}{2}\right)^4$です。これらのうち最小の$2+\left(-\frac{1}{2}\right)^4$は$A_3$の要素ですが、$A_1$の要素でもあり、$A_2$の要素でもあります。すなわち

$$2+\left(-\frac{1}{2}\right)^4\in A_1\cup A_2\cup A_3$$

であり、かつ

$$2+\left(-\frac{1}{2}\right)^4\in A_1\cap A_2\cap A_3$$

また同様に

$$2+\left(-\frac{1}{2}\right)^4\in A_2\cup A_3$$

であり、かつ

$$2+\left(-\frac{1}{2}\right)^4\in A_2\cap A_3$$

さらに

$$2+\left(-\frac{1}{2}\right)^4\in A_3$$

つまり、収束先の候補は、最小上界の候補となる集合をすべて集め、そのいずれにも入っている要素だということになります(簡単化のためにこのようになる部分列を作成しました)。集合の記法では、候補をすべて集めることを$\bigcup$で、いずれにも入っていることを$\bigcap$で表します。よって

$$収束先の候補=2+\left(-\frac{1}{2}\right)^4\in A_3\subset\bigcap_{j=1}^{3}\bigcup_{n=j}^{3}A_n$$

調べる集合の数を増やすにしたがい、収束先の候補が絞り込まれるイメージです。3を3より大きい$J$に一般化すると、候補はさらに絞られます。

$$A_J\subset\bigcap_{j=1}^{J}\bigcup_{n=j}^{J}A_n$$

測度の単調性から

$$\mu(A_J)\leq\mu\left(\bigcap_{j=1}^{J}\bigcup_{n=j}^{J}A_n\right)$$

$J$を限りなく大きくすると(記述の煩雑さを避けるために$J$を $j$ に置き換えています)

$$\lim_{j\rightarrow\infty}\sup\mu(A_j)\leq\mu\left(\bigcap_{j=1}^{\infty}\bigcup_{n=j}^{\infty}A_n\right)$$

下極限は、上極限と対称をなしますので(と簡単に書くとお叱りを受けますが…)

$$\mu\left(\bigcup_{j=1}^{\infty}\bigcap_{n=j}^{\infty}A_n\right)\leq\lim_{j\rightarrow\infty}\inf\mu(A_j)$$

※集合の記法はとても難しいです。こちらを参照しました。
こちらは英語ですが、とてつもなくhelpfulです。


ファトゥの補題
ここまでの結果をまとめると、数列の上極限と下極限を集合の上極限と下極限ではさみこむことができます。すなわち、$\mu(\bigcup_{j=1}^{\infty}A_j)$が有限であるとき、次の不等式が成り立ちます。

$$\mu\left(\bigcup_{j=1}^{\infty}\bigcap_{n=j}^{\infty}A_n\right)\leq\lim_{j\rightarrow\infty}\inf\mu(A_j)$$
$$\leq\lim_{j\rightarrow\infty}\sup\mu(A_j)\leq\mu\left(\bigcap_{j=1}^{\infty}\bigcup_{n=j}^{\infty}A_n\right)$$

これを極限の記法で書くと

$$\mu(\lim_{j\rightarrow\infty}\inf A_j)\leq\lim_{j\rightarrow\infty}\inf\mu(A_j)$$
$$\qquad\qquad\leq\lim_{j\rightarrow\infty}\sup\mu(A_j)\leq\mu(\lim_{j\rightarrow\infty}\sup A_j)$$

この結果をファトゥの補題(Fatou's lemma)といいます。(志賀浩二『ルベーグ積分30講』p.83)

「ファトゥの補題はルベーグ積分に関するもので、集合に関するものではない」と言われるかもしれません。この後少しずつ学ぶと見えてくると思いますが、ルベーグ=カラテオドリの測度はそのままルベーグ積分です。積分の記法で書くと(志賀浩二『ルベーグ積分30講』p.155は積分表記をファトゥの不等式と呼び、単調収束定理を用いて証明しています。詳細な証明は『数の落とし子』の方が説明されています。今の私にはとても追いきれませんでしたが… こちらもあわせて参照しました。)

$$\int\lim_{j\rightarrow\infty}\inf f_j d\mu\leq\lim_{j\rightarrow\infty}\inf\int f_j d\mu$$
$$\qquad\qquad\leq\lim_{j\rightarrow\infty}\sup\int f_j d\mu\leq\int\lim_{j\rightarrow\infty}\sup f_j d\mu$$

積分は測度の一形態であるとは、ルベーグの慧眼です。


2024年5月8日

σ加法族(Lebesgue Measure)

※私は数学者ではありません。自分用のまとめとしてこれを書いています。楽しむ範囲でご覧いただければ幸いです。内容の正確性については専門家のサイトや動画、あるいは専門書で必ず確認をお願いします。


*  *  *


前回は集合族の測度についてみました。今回は、σ加法族について紹介します。

本格的に確率を学びたいと思って専門書を開くと、たいがい1ページ目にσ加法族が登場します。私たちの大半は、この用語を見た瞬間に頭が真っ白になり、開いたばかりの本を閉じ、図書館の書棚にそっと返してしまいます。この段階をなんとか超えたいな、と思います。


べき集合
集合$A$の要素からなるすべての部分集合の集まりをべき集合(power set) といい、$2^A$と表記します。2の$A$乗と書くのは、$A$の要素の数が$A$個あるとき、べき集合の要素の数は$2^A$個存在するためです。

コイントスの結果、表が出ることを1、裏が出ることを2としましょう。これは、2つの要素からなる集合として表記できます。

 $$A=\{1, 2\}$$

$A$のべき集合は

$$2^A=\{\varnothing, 1, 2, \{1, 2\} \}$$

確かに要素の数は$2^A=2^2=4$個あります。集合の要素の数が3なら8、4なら16の要素がべき集合にあります。


σ加法族
準備が整いましたので、σ加法族を定義します。集合$X$のべき集合 $2^X$を$\mathcal{F}$とおき、$A$を$\mathcal{F}$の任意の要素とします。このとき、次の条件を満たす$\mathcal{F}$をσ加法族(σ-field, σ-algebra)といいます。

  1. $\varnothing\in\mathcal{F}$
  2. $A\in\mathcal{F} \implies A^c\in\mathcal{F}$
  3. $\{\boldsymbol{A}_j\}\subset\mathcal{F} \implies \bigcup_{j=1}^{\infty}A_j\in\mathcal{F}$

1つめは、空集合が$\mathcal{F}$の要素であるということです。上のコイントスの例でも、べき集合の要素に空集合がきちんと入っています。

2つめは、これが$\mathcal{F}$の要素ならこれ以外も$\mathcal{F}$の要素だということです。コイントスの例では「表が出る:1」と「裏が出る:2」はともに$\mathcal{F}$の要素です。同様に「表か裏が出る: $\{1, 2\}$」と表も裏も出ない、すなわち「空集合:$\varnothing$」はともに$\mathcal{F}$の要素です。

3つめは、可算無限の集合列の要素すべてが$\mathcal{F}$の要素なら、その和集合も$\mathcal{F}$の要素だということです。コイントスの例は有限集合ですが、気持ちだけ眺めると…

$$\{\varnothing, 1, 2, \{1, 2\} \}$$

のすべての要素の和集合は$ \{1, 2\}$です。これは明らかに$\mathcal{F}$の要素です。

条件2と条件3を用いれば、$\bigcap_{j=1}^{\infty}A_j$も$\mathcal{F}$の要素だと確かめられます。条件2から、$A\in\mathcal{F}$なら$A^c\in\mathcal{F}$です。条件3から、その和集合も$\mathcal{F}$の要素です。すなわち

$$\{\boldsymbol{A}_j^c\}\subset\mathcal{F} \implies \bigcup_{j=1}^{\infty}A_j^c\in\mathcal{F}$$

再び条件2から

$$\left(\bigcup_{j=1}^{\infty}A_j^c\right)^c=\bigcap_{j=1}^{\infty}A_j\in\mathcal{F}$$

σ加法族は、測る場としてよい性質を持っています。コイントスの例では、表が出る確率、裏が出る確率、表か裏が出る確率、表も裏も出ない確率、起こりうる事象すべてを確率の計測対象にできます。確率を測る場として心地よいです。

確率などを測れる場という意味で、集合$F$から生成されたσ加法族$\mathcal{F}$を可測空間(measurable space)といい、$(F, \mathcal{F})$と表記します。確率論の専門書によく$(\Omega, \mathcal{F}, P)$と書いてありますが、これは可測空間を確率測度$P$で測ること意味しています。


*  *  *


σ加法族の生成
もとの集合$F$からσ加法族を作成することもできます。集合$F$から最小のσ加法族を作成する作業を生成(generate)といいます。集合$F$から生成されたσ加法族を$\sigma(F)$と表記します。

上で用いたコイントスの例を少しだけ拡張してみましょう。コインを2回投げた結果は次の4とおりです。

$4=\{表, 表\}$
$3=\{表, 裏\}$
$2=\{裏, 表\}$
$1=\{裏, 裏\}$

それぞれに4から1までの番号をつけました。これらを集めた集合$F$は次のようになります。

$$F=\{1, 2, 3, 4\}$$

この集合から生成されるσ加法族$\sigma(\{1, 2\})$は

$$\sigma(\{1, 2\})=\{\varnothing, F, \{1, 2\}, \{3, 4\}\}$$

となります。これがσ加法族であることを確かめましょう。この記事のはじめに書いた3条件のうちの1つめは、空集合がσ加法族の要素であるということです。空集合は確かに$\sigma(\{1, 2\})$の要素です。

3条件のうちの2つめは、補集合がσ加法族の要素であるということです。ここまでで$\sigma(\{1, 2\})$の要素になっているのは$\{\{1, 2\}, \varnothing\}$です。これらの補集合はそれぞれ

$$\{1, 2\}^c \implies \{3, 4\}$$
$$\varnothing^c \implies F$$

確かにこれらも$\sigma(\{1, 2\})$の要素です。3条件のうちの3つめは、生成されたσ加法族のすべての要素の和集合が$\sigma(\{1, 2\})$の要素であるということです。

$$F=\varnothing\cup F\cup\{1, 2\}\cup\{3, 4\}$$

は明らかです。よって、3条件すべてを満たす$\sigma(\{1, 2\})$は集合$E$から生成されたσ加法族だといえます。


*  *  *


とりかかりは、これくらいでいいかなと思います。ボレル集合族はあまりに壮大ですので…

ルベーグ測度の世界では零集合が決定的な役割を果たすように思います(志賀浩二『ルベーグ積分30講』pp.52-53)。おおげさかもしれませんが、虚数単位 $i$ と同じくらいの役割を果たしていそうです。そのうちだんだんみえてくるでしよう…






可測集合族の測度(Lebesgue Measure)

※私は数学者ではありません。自分用のまとめとしてこれを書いています。楽しむ範囲でご覧いただければ幸いです。内容の正確性については専門家のサイトや動画、あるいは専門書で必ず確認をお願いします。


*  *  *


前回は様々な集合の可測性を調べました。今回はそのつづきです。集合の重なりがないときの測度、集合がずらりと並ぶ集合族と集合列の測度についてみます。


素集合
素(disjoint)とは、重なっていないということです。たとえば、神奈川県と秋田県は地図上で重なっていません。「この番地は神奈川県であり、秋田県でもあります」というところはないはずです。集合$A$と$B$の両方に入る要素が1つもないことを互いに素といい、そのような集合を素集合(disjoint sets)といいます。式で書くと

$$A\cap B=\varnothing$$

$A$と$B$が可測であるとき、素集合の測度は$A$の測度と$B$の測度の和と等しくなります。

$$\mu(A\cup B)=\mu(A)+\mu(B)$$

神奈川県と秋田県を合わせた面積は、神奈川県の面積と秋田県の面積の和に等しいという、私たちの感覚に合う結論が測度の世界でも得られます。


集合族
つづいて、集合を有限個並べ集合にしたもの$\{A_1, A_2, A_3, …, A_J\}$について考えます。こうしたものを集合族(familiy of sets)といいます。すべての要素が可測集合である集合族の和集合と積集合は、ともに可測です。すなわち

$$\bigcap_{j=1}^JA_j    \bigcup_{j=1}^JA_j$$

はともに可測です。すべての$j\neq k$について$A_j\cap A_k=\varnothing$であれば、和集合の測度は完全加法性を満たします。すなわち

$$\mu\left(\bigcup_{j=1}^JA_j\right)=\sum_{j=1}^J\mu(A_j)$$

47都道府県からなる日本国の面積は各都道府県の面積の和であるというこの結論は、私たちの感覚に合います。数学は難しいものではありますが、奇を衒った突拍子もないものではありません。大半は極めて常識的なものです。


集合列
さらに、集合を可算無限個並べた集合$\{A_1, A_2, A_3, …\}$に拡張しましょう。こうしたものを集合列(sequence of sets)といいます。すべての$j\neq k$について$A_j\cap A_k=\varnothing$であれば、可測な集合列の和の測度も完全加法性を満たします。すなわち

$$\mu\left(\bigcup_{j=1}^{\infty}A_j\right)=\sum_{j=1}^{\infty}\mu(A_j)$$

集合列の要素がどんどん大きくなるとき、すなわち、すべての $j$ について $A_j\subset A_{j+1}$であるとき、単調増加な集合列といいます。この測度は最後の、つまり最大の要素の測度に収束します。

$$\mu\left(\bigcup_{j=1}^{\infty}A_j\right)=\lim_{j\rightarrow\infty}\mu(A_j)$$

ある人の居住地を最も小さな単位で表すと、「5階1号室に住んでいます」などとなります。1段階大きなくくりでは「〇〇マンションに住んでいます」、くくりを少しずつ大きくしてゆくと「△△市に住んでいます」「××県に住んでいます」「日本国に住んでいます」「地球に住んでいます」…となります。最後の一番大きなくくりにそれまでのくくりすべてが含まれています。単調増加とはこういう状況です。

単調増加な集合列と対をなすのが単調減少な集合列です。これは、要素がどんどん小さくなる、つまりすべての $j$ について$A_{j+1}\subset A_j$であるような集合列です。この測度は最後の、つまり最小の要素の測度に収束します。

$$\mu\left(\bigcap_{j=1}^{\infty}A_j\right)=\lim_{j\rightarrow\infty}\mu(A_j)$$

ただし、$\mu(A_1)$は有限とします(最小の要素の測度になるのだから、この条件は不要にみえますが、証明の過程で必要となります)。この式は上式とよく似ていますが、上式は和$\bigcup$、この式は積$\bigcap$であることに注意しましょう。

玉ねぎ🧅を横で輪切りにすると同心円状にリングが重なっていますよね。リングを外側から1枚ずつ取り除いてゆくと、最後に一番小さな真ん中だけが残ります。単調減少とはそんなイメージです。


2024年5月7日

空集合、全体集合、零集合、補集合、和集合、積集合の可測性(Lebesgue Measure)

※私は数学者ではありません。自分用のまとめとしてこれを書いています。楽しむ範囲でご覧いただければ幸いです。内容の正確性については専門家のサイトや動画、あるいは専門書で必ず確認をお願いします。


*  *  *


前回の記事で測度を定義しました。今回はそのつづきです。集合$X$の様々な部分集合と要素の可測性を調べます。


空集合と全体集合
空集合$\varnothing$と全体集合$X$は可測です。これは、可測性の定義式にこれらを代入してすぐ確かめられます。

$$\mu(E\cap \varnothing)+\mu(E-\varnothing)=\mu(\varnothing)+\mu(E)=\mu(E)$$
$$\mu(E\cap X)+\mu(E-X)=\mu(E)+\mu(\varnothing)=\mu(E)$$


零集合
最小の測度を持つ要素、もしくはその集まりを零集合(null set)といいます。零集合の可測性を調べてみましょう。

$$\mu(E\cap A)+\mu(E-A)\leq\mu(A)+\mu(E)=\mu(E)$$

第1項は最小の測度を持つ零集合と任意の集合の積が零集合であることから、第2項は集合から集合を引いた結果がもとの集合以下であることから、このように変形できます。最右の等式は$\mu(A)=0$(最小の測度は0というのが測度の基本性質)であることから得られます。上式の最左と最右に注目すると

$$\mu(E\cap A)+\mu(E-A)\leq\mu(E)$$

これは、前回紹介した可測性の弱い条件ですので、可測性が確認できました。空集合も零集合ですので可測です。


補集合
集合$X$の部分集合$A$に対して、$A$ではないものを補集合といい、$A^c$と表記します。いわゆる、ではないほうが補集合です。$A$が可測であるとき、$A^c$の可測性を調べましょう。

$$\mu(E\cap A^c)+\mu(E-A^c)=\mu(E-A)+\mu(E\cap A)$$

第1項は「ではないほうと重なる」と「であるほうを除く」が同じであることから、第2項は「ではないほうを除く」と「であるほうと重なる」が同じであることから、このように変形できます。右辺の第1項と第2項を入れ替えると

$$\mu(E\cap A)+\mu(E-A)$$

これはとりもなおさず可測性の定義式です。

$$\mu(E)=\mu(E\cap A)+\mu(E-A)$$

右辺の各項を補集合の表記に戻せば、補集合の可測性が確認できます。

$$\mu(E)=\mu(E\cap A^c)+\mu(E-A^c)$$


和集合と積集合
集合$X$の部分集合$A, B$の和集合とは、集合$A$または$B$に入る要素すべての集まりであり、$A\cup B$と表記します。積集合とは、集合$A$と$B$の両方に入る要素すべての集まりであり、$A\cap B$と表記します。和集合はまたは、積集合はかつですので

$$A\cap B\subset A\cup B$$

となります。可測である集合$A$と$B$の和集合の可測性を調べましょう。可測性の定義式は

$$\mu(E)=\mu(E\cap A)+\mu(E-A)$$

$B$が可測であることを用いて$\mu(E-A)$を測ると

$$\mu(E-A)=\mu((E-A)\cap B)+\mu((E-A)-B)$$

これを上式の右辺第2項に代入すると

$$\mu(E)=\mu(E\cap A)+\mu((E-A)\cap B)+\mu((E-A)-B)$$

右辺第3項の形を少し変えると、項の中に和集合が現れます。

$$\mu(E)=\mu(E\cap A)+\mu((E-A)\cap B)+\mu(E-(A\cup B))$$

この式を式(*)とおきましょう。右辺の第1項と第2項は、和集合の可測性の定義式の第1項 $\mu(E\cap (A\cup B))$と何らか比べられるべきです。少しトリッキーですが、この集合を次のように変形します。

$$E\cap (A\cup B)=(E\cap A)\cup(E\cap B)$$
$$\qquad\qquad\qquad\qquad=(E\cap A)\cup((E-A)\cap B)$$

劣加法性から

$$\mu(E\cap (A\cup B))=\mu((E\cap A)\cup((E-A)\cap B))$$
$$\qquad\qquad\qquad\quad\leq\mu(E\cap A)+\mu((E-A)\cap B)$$

これは、この式の最左辺が、式(*)の右辺第1項と第2項の和より小さいことを意味します。式(*)の右辺第1項と第2項が最右辺であれば等式が成立しますから、それより小さい左辺を代入すれば、関係は$\geq$になります。すなわち

$$\mu(E)\geq\mu(E\cap(A\cup B))+\mu(E-(A\cup B))$$

この式は、可測集合$A, B$の和集合が可測であることの定義式です。

さいごに、可測集合$A, B$の積集合の可測性を調べましょう。補集合と和集合はすでに可測であることが確かめられていますので、次のような変形から可測であることが示されます。

$$(A^c\cup B^c)^c=A\cap B$$

私たちがよくみかける集合について、可測性が確認できました。


ジョルダン、ルベーグ、カラテオドリ(Lebesgue Measure)

※私は数学者ではありません。自分用のまとめとしてこれを書いています。楽しむ範囲でご覧いただければ幸いです。内容の正確性については専門家のサイトや動画、あるいは専門書で必ず確認をお願いします。


*  *  *


前回までで、距離空間のシリーズをひとまず終えました。次のテーマとして測度とベクトル空間を候補にしたのですが、まずは測るということの理解を深めたいと思い、ルベーグ測度のシリーズにしました。


  • ルベーグ測度:測る
  • ベクトル空間:計算する


*  *  *


私たちは、日常生活の中でいろいろなものを測っています。距離を測ったり、面積や体積を測ったり、重さを測ったり、個数を測ったり、気温を測ったり、高度を測ったり、濃度を測ったり、照度を測ったり、彩度を測ったり、比率を測ったり、確率を測ったりします。こうしたことができるのは、測りかたのルールがきちんと定まっているためです。

フランス人のルベーグ(Henri Léon Lebesgue:1875-1941)という人は、測りかたを深く探究した数学者です。1789年大革命でメートル法を提唱したフランスの伝統は、この人の理論に息づいているのでしょう。

こちらの記事によれば、メートル法以前には800とおりもの測りかたがあったようです…


*  *  *


内測度と外測度
入り組んだ形をした敷地の面積を近似することを考えます。

まず、敷地の境界にかからないように有限個のタイルを敷地内側に敷き詰め、そのタイルの面積の総和で敷地面積を近似する方法があります。これを内測度(inner measure)といいます。もうひとつ、敷地の境界にほんのわずかだけかかるように有限個のタイルを敷き詰め、そのタイルの面積の総和で敷地の面積を近似する方法があります。これを外測度(exterior measure, outer measure)といいます。

内測度の上限外測度の下限が等しいことを可測(measurable)といいます。


ジョルダンの測度
敷き詰めるタイルが大きいとき、内測度は外測度より小さくなります。1m四方のタイルは、曲線を描く敷地にピッタリ敷き詰められず、隙間ができます。これを敷地境界にかかるように敷き詰めると、大きくはみ出します。

敷地へのフィット感を高めるために、タイルを50cm四方、10cm四方、5cm四方、1cm四方、…とどんどん小さくしてみましょう。とてつもなく変な形をした敷地でない限り、あるところで内測度の上限と外測度の下限が一致します。この可測な敷地の面積をジョルダン測度(Jordan measure)といいます。


ルベーグの測度
ジョルダンは、敷地に有限個のタイルを敷き詰めることを考えました。この考えを拡張して、敷地に可算無限個のタイルを敷き詰めることを考えたのがルベーグです。

敷き詰めるタイルの枚数を可算無限個へ拡張すると、ジョルダン不可測な敷地の面積も測れるようになります。ここでは、1m四方の正方形から、縦横ともに有理数の値をもつ可算無限個の点(有理点)をすべて除いた図形を例にします(志賀浩二『ルベーグ積分30講』p.41, 図13)。極小・無数の穴が空いた1m四方のメッシュのイメージです。

ジョルダンの方法にはタイルが有限個しかありませんので、可算無限個の穴すべてをカバーできません。ルベーグの方法にはタイルが可算無限個用意されていますので、穴すべてをカバーできます。極小のタイルでカバーした穴それぞれの面積を0とみると、それを可算無限個足し合わせた面積も0になります。すると、このとてつもなく変な形をした敷地の面積は1平方メートルと0の差、1平方メートルとなります。

$$外側から測った正方形の面積-可算無限個の穴の面積総計$$
$$=1-0=1$$

(志賀浩二『ルベーグ積分30講』p.99は、閉包と内点集合が一致しないときジョルダンの測度が機能せず、ルベーグ測度が有用になると指摘しています。)


*  *  *


ルベーグの考えをまとめましょう。 $j(.), m_*(.), m^*(.)$をそれぞれ、ジョルダン測度、ルベーグ内測度、ルベーグ外測度とします。このとき集合$A$のルベーグ内測度$m_*(A)$は、ジョルダン可測な大枠$E$と、$E$から$A$を除いた部分($E-A$の外測度)の差となります。すなわち

$$m_*(A)=j(E)-m^*(E-A)$$

集合$A$の中心部からきわへ向かって外測度の上限をとり、$A$の外側を塗りつぶすと$A$が浮かび上がるイメージです。ルベーグ可測であるとき、内測度と外測度は等しくなります。よって

$$m^*(A)=j(E)-m^*(E-A)$$


*  *  *


カラテオドリの可測
上式の右辺にある$m^*(E-A)$を移項して、左右入れ替えると

$$j(E)=m^*(A)+m^*(E-A)$$

$A$が可測であるとき$j(E)=m^*(E)$であり、また$A$が$E$の部分集合であることに注目すると$m^*(A)=m^*(E\cap A)$が成り立ちます。これらを代入すると

$$m^*(E)=m^*(E\cap A)+m^*(E-A)$$

ルベーグの外測度$m^*(.)$を$\mu(.)$に置き換えると

$$\mu(E)=\mu(E\cap A)+\mu(E-A)$$

すべての$E$についてこの式が成り立つとき、$A$は可測であるといいます。このように表現するのは、もともと$A$の可測性を示す式を変形して得られた式であるためです。上式は次のようにも書けます。$A^c$の可測性については次回説明します。

$$\mu(E)=\mu(E\cap A)+\mu(E\cap A^c)$$

この式は、$A$に含まれるものと含まれないものに$E$を二分して測った測度の和が、$E$の測度に等しいことを示しています。距離空間でもデデキントの定理、ベールのカテゴリー定理、可分性など全体を二分する話が出てきました。数学では「これとこれ以外」という分けかたが認識の基礎になっているようです。この可測の条件は、ルベーグと同じ世代のギリシャ人数学者、カラテオドリ(Constantin Carathéodory)が提示しました。それで、カラテオドリの条件といいます。


*  *  *


カラテオドリ測度の性質
カラテオドリの外測度(exterior measure, outer measure)には次のような性質があります。

  1. $0\leq\mu(A)\leq\infty$
  2. $\mu(\varnothing)=0$
  3. $A\subset E \implies \mu(A)\leq\mu(E)$
  4. $A\subset\bigcup_{j=1}^{\infty}A_j \implies \mu(A)\leq\sum_{j=1}^{\infty}\mu(A_j)$ 

記号ばかりですので説明を加えます。まず1ですが、測度はマイナスの値をとりませんが、無限大まで大きな値はとりうるということです。

つづいて2ですが、これは空集合$\varnothing$を測った値を0とするということです。空集合とは、何も載っていないお皿🍽️のイメージです。お皿に何か載っている🍛のであれば、カロリーを測ったり、重さを測ったり、大きさを測ったりできますが、何も載っていなければ測りようがありません。そうしたものの値は0にするということです。条件1で測度の下限を0にしましたが、これは空集合の測度を0と定義することによります。

3は単調性(monotonicity)といわれる性質です。より大きなものにより大きな値を与えるという測度の性質です。たとえば、東京都より日本国のほうが大きいので、東京都の面積より日本国の面積のほうが広いと評価するということです。もし「東京都の面積より日本国の面積のほうが狭いです」と言われると、私たちは「えっ?」となってしまいます。「他も含めた敷地の面積はもとの敷地の面積より広くなる」という、私たちの常識的な感覚と合う測度の性質が単調性です。

4は劣加法性(subadditivity)といわれる特徴です。外測度を測るとき、敷き詰めるタイルが重なっていても構いません。また、境界にかかるようにタイルを敷き詰めます。それで、敷き詰めたタイルそれぞれの面積の合計は敷地面積以上になります。距離空間には三角不等式がありました。これは、ゴールに真っ直ぐ突き進むより、どこかに立ち寄ったほうが距離は長くなるという性質です。この特徴を、より一般的な測度の世界でも保つということです。

条件4を用いると、可測の条件を弱く表現できます。

$$\mu(E)\geq\mu(E\cap A)+\mu(E\cap A^c)$$

なぜかというと、逆向きの不等式($\leq$)は条件4そのものだからです。


*  *  *


一般的理論に還元されてしまうと、数学は内容のない単なる美しい形式になってしまう。そしてそれはすぐに死にたえてしまう

(ルベーグの言葉を引用したメルツバッハ=ボイヤー『数学の歴史』からの引用を引用した志賀浩二『ルベーグ積分30講』数学30講シリーズ, 9, 朝倉書店, 1991, p.38)


2024年5月5日

距離空間の可分性(Metric Space)

※私は数学者ではありません。自分用のまとめとしてこれを書いています。楽しむ範囲でご覧いただければ幸いです。内容の正確性については専門家のサイトや動画、あるいは専門書で必ず確認をお願いします。


*  *  *


距離空間$(X, d)$において、可算・稠密な部分集合があることを可分(separable)といいます。たとえば、実数には可算・稠密な有理数という部分集合がありますので、可分です(ベールのカテゴリー定理)。言い換えると、下式のように、部分集合の閉包(部分集合とその導集合の和)が全体集合になっているとき、可分といいます。

$$\mathbb{R}=\overline{\mathbb{Q}}=\mathbb{Q}\cup\mathbb{Q}^d$$


p-ユークリッド空間
$N$次元の実数$\mathbb{R}$の距離空間$(\mathbb{R}^N, d)$の可分性について考えます。ここで距離の測りかた$d_p$を次のように定義します。

$$d_p=\left(\sum_{n=1}^N|x_n-y_n|^p\right)^{1/p}$$

ここで、$p$は1以上の有限な実数です。$p$の値が無限大であるときには、各要素どうしの距離のうち最長のものを距離とします。

$$d_{\infty}=\left(\sum_{n=1}^N|x_n-y_n|^{\infty}\right)^{1/{\infty}}=\max_{1\leq n\leq N}|x_n-y_n|$$

$d_{\infty}$が$\max$関数になるのは、絶対値で測った最長の距離を無限大乗した値は、他の小さな値の無限大乗を圧倒(dominate)するためです。最長の距離以外のものは視界から消えるということです。

これらの距離空間はいずれも可分です。なぜかというと、実数は有理数 $\mathbb{Q}$と無理数(有理数の集積点、つまり有理数$\mathbb{Q}$の導集合の要素)の和集合だからです。任意の実数$x$について

$$x\in\mathbb{Q}\cup\mathbb{Q}^d$$

右辺は閉包に等しいので

$$\mathbb{R}=\overline{\mathbb{Q}}$$

これは可分の定義そのものです。


$l^p$空間
数列(sequence of numbers)とは、数を並べたものです。似たものに点列がありますが、点列は空間に置かれた点の集まりです。1次元の点列が数列です。

次の条件を満たす実数からなる数列$\{\boldsymbol{x}_j\}_{j=1}^{\infty}$を$l^p$空間といいます。

$$\sum_{j=1}^{\infty}|x_j|^p<\infty$$

この空間での距離の測りかた $d$ を次のように定義します。

$$d_p(\{\boldsymbol{x}_j\}_{j=1}^{\infty}, \{\boldsymbol{y}_j\}_{j=1}^{\infty})=\left(\sum_{j=1}^{\infty}|x_j-y_j|^p\right)^{1/p}$$

この数列空間も、上と同様の議論から可分です。


$l^{\infty}$空間
$l^p$空間の$p$を無限大にしたものを$l^{\infty}$空間といいます。この空間での距離の測りかた $d$ を次のように定義します。

$$d_{\infty}(\{\boldsymbol{x}_j\}_{j=1}^{\infty}, \{\boldsymbol{y}_j\}_{j=1}^{\infty})=\sup_{j\in\mathbb{N}}|x_j-y_j|$$

$l^{\infty}$空間内の集合$E$は可算ではなく、稠密でもありません。したがって $l^{\infty}$空間は可分ではありません。この証明のラフ・スケッチは次のとおりです(現時点の私の理解の範囲内です)。


*  *  *


実数直線上の閉区間$[0, 1]$を例にとります。この区間内の数は複数の2進数展開で表すことができます。たとえば、0.5は

$$0.5=\frac{1}{2}+\sum_{j=2}^{\infty}\frac{0}{2^j}$$


$$0.5=\frac{0}{2}+\sum_{j=2}^{\infty}\frac{1}{2^j}$$

このことは、閉区間$[0, 1]$内の数を表す2進数展開の分子を数列に見立てたものの濃度は、閉区間$[0, 1]$の濃度以上であることを意味します。つまり

$$\aleph\leq|2進数展開の分子を数列に見立てたもの|$$

この不等式は、可分性の条件の1つである可算と矛盾します。

もう1つの条件は稠密ですが、これは集積点がとれるかどうかで判定します。閉区間$[0, 1]$から互いにごく近い2点$x, y$を取り出し、2進数展開します。$x$と$y$の値が異なるということは、2進数展開のいずれかの項の値が異なるということです。たとえば、第 $j$ 項の値だけが次のように異なるとしましょう。

$$xの第 j 項:\frac{1}{2^j}  yの第 j 項:\frac{0}{2^j}$$

ここで分子だけ取り出すと1と0になります。したがって、$x, y$の距離を $l^{\infty}$で測ると、絶対値ですから1になります。この1は孤立点となり、集積点になりえません。これは、$x, y$を表す2進数展開の数列の$l^{\infty}$距離が稠密でないことを意味します。

可分の条件である可算も稠密も満たさないことから、数列空間$l^{\infty}$は可分ではないことがわかりました。


*  *  *

証明の詳細はとても難しいです。また理解が進んだら戻ってきて、よりよい形になるよう加筆・修正したいと思います。


2024年5月4日

集合の直径、集合と集合の距離、集合と点の距離(Metric Space)

※私は数学者ではありません。自分用のまとめとしてこれを書いています。楽しむ範囲でご覧いただければ幸いです。内容の正確性については専門家のサイトや動画、あるいは専門書で必ず確認をお願いします。


*  *  *


2点間の距離を応用すれば、点と集合の距離や集合と集合の距離も測れそうです。また、集合の幅のようなもの(集合の直径)も測れそうです。今回は、これらの測りかたを紹介します。以下はすべて距離空間 $(X, d)$についての話であり、$x$は$X$の要素、$A, B, E$は$X$の非空な部分集合とします。


点と集合の距離
まず、点と集合(要素の集まり)の距離を考えましょう。直感的には、点と集合内の各要素の距離のうち、最も短いものが点と集合の距離になりそうです。日常会話で「コンビニまでの距離」と言うとき、最寄りのコンビニまでの距離ですよね。距離空間では、この直感どおりに点と集合の距離を定義します。点$x^*$と集合$E$の距離は

$$d(x^*, E)=\inf\{d(x^*, x)|x\in E\}$$

$\inf$は下限です。高校のとき、点と線の距離という単元がありました。あのとき、点から線に向かって垂線(直角に交わる線)を引いたのは、点から線という集合への最短距離を測るためでした。

$x^*$が集合$E$の内点または境界点であるとき、点と集合の距離は0です。


集合と集合の距離
つづいて、集合と集合の距離を測りましょう。距離空間では、集合$A$と集合$B$の距離を次のように測ります。

$$d(A , B)=\inf\{d(a, b)|a\in A, b\in B\}$$

これも、最寄りの距離です。コンビニとドラッグストアの距離というとき、コンビニの隣にドラックストアが立地していれば、その距離を測りましょうということです。これも直感に合います。わざわざ目の前のコンビニと隣町のドラッグストアの距離を測らないですよね。

集合$A$と$B$に共通部分があるとき($A\cap B\neq\varnothing$)、2つの集合の距離は0とします。商業施設の中にコンビニとドラッグストアが併設されているとき、どちらも商業施設内にあるという意味では、距離が0だと言えます。


集合の直径
集合の直径についても考えることができます。$X$の有界な部分集合$E$の直径(diameter)を、その要素$x_1, x_2$で表すと

$$diam(E)=\sup\{d(x_1, x_2)|x_1, x_2\in E\}$$

$\sup$は上限です。集合が楕円のような形をしているとき、長径(長い方の「直径」)を集合の直径とする、というイメージです。

$E$が1点集合(要素が1つだけ)であるとき、直径は0です。

ここまでの知識を用いると、集合と集合の距離、そして集合の直径の関係を表すことができます。2つの集合$A$と$B$について

$$diam(A\cup B)\leq diam(A)+diam(B)+d(A, B)$$

上でも書きましたが、$A$と$B$に共通部分があるとき$d(A, B)=0$になります。$A$と$B$に共通部分がないときには$d(A, B)>0$になります。


距離の写像の連続性
ここまで、点は動かないと仮定していました。点が連続に動くとき、点 $x$ と集合$E$の距離を次のような連続写像とみなすことができます。

$$f:X\rightarrow \mathbb{R}^+$$

ここで用いる連続の概念はリプシッツ連続です。すなわち、写像 $f$ は次の条件を満たします。

$$d(f(x_1), f(x_2))\leq K\cdot d(x_1, x_2)$$

この不等式が成り立つことを示しましょう。すべての$x\in E$について、点と集合の距離の定義から、次の不等式が成り立ちます。

$$d(x_1, E)\leq d(x_1, x)$$

これは、点$x_1$と集合$E$の距離は、2点$x_1$と$x$の距離のうち最短のものであるという、点と集合の距離の定義からわかります。つづいて、右辺に三角不等式を適用すると

$$d(x_1, E)\leq d(x_1, x)\leq d(x_1, x_2)+d(x_2, x)$$

真ん中の式を除いて、最左と最右の式に注目します。

$$d(x_1, E)\leq d(x_1, x_2)+d(x_2, x)$$

この式は任意の$x$について成り立ちます。$\inf d(x_2, x)=d(x_2, E)$であることに注意して、$d(x_2, x)$に$d(x_2, E)$を代入して左辺に移項すると

$$d(x_1, E)-d(x_2, E)\leq d(x_1, x_2)$$

$x_1$と$x_2$を入れ替えてもこの関係は成り立つので

$$d(x_2, E)-d(x_1, E)\leq d(x_2, x_1)$$

距離の定義から$d(x_1, x_2)=d(x_2, x_1)$が成り立つことに注意して、上の2式をまとめると

$$|d(x_1, E)-d(x_2, E)|\leq d(x_1, x_2)$$

左辺の絶対値は距離の尺度とみなせます。すなわち

$$d(f(x_1), f(x_2))=|d(x_1, E)-d(x_2, E)|$$

すると

$$d(f(x_1), f(x_2))=|d(x_1, E)-d(x_2, E)|\leq d(x_1, x_2)$$

ここで、すべての$\varepsilon>0$について$d(x_1, x_2)<\varepsilon$とすると

$$d(f(x_1), f(x_2))\leq d(x_1, x_2)<\varepsilon$$

$d(x_1, x_2)$は$\varepsilon$に上から抑えられ、$d(f(x_1), f(x_2))$は $d(x_1, x_2)$に上から抑えられることがわかりました。これは、リプシッツ連続の条件そのものです。


2024年5月1日

ユークリッド空間(Metric Space)

※私は数学者ではありません。自分用のまとめとしてこれを書いています。楽しむ範囲でご覧いただければ幸いです。内容の正確性については専門家のサイトや動画、あるいは専門書で必ず確認をお願いします。


*  *  *


今回は、ユークリッド空間が距離空間であることを確認します。


コーシー=シュワルツの不等式
準備として、まずコーシー=シュワルツ(Cauchy-Schwarz)の不等式を紹介します。この不等式にはさまざまな相貌がありますが、ここで使うのに十分な次式を用います。

$$\left(\boldsymbol{ab}\right)^2\leq\boldsymbol{a}^2\boldsymbol{b}^2$$

ここで、$\boldsymbol{a}$ と $\boldsymbol{b}$ はともにベクトルです。この不等式が成り立つことを大まかにみましょう。以下、見やすくするために $a$ と $b$ は太字にしません。少しトリックめいていますが、実数 $t$ に関する式$(at+b)^2$を作り、展開してみます。

$$(at+b)^2=a^2t^2+2abt+b^2$$

左辺は実数を2乗していますので非負です。また、$a\neq 0$であるとき、下に凸な2次関数になります。これらのことに注意して判別式を書くと

$$D=(2ab)^2-4a^2b^2\leq 0$$

$$(ab)^2\leq a^2b^2$$

不等式が得られました。$a=0$であるときも、この式は等式として成り立ちます。


ユークリッド空間
幾何的な分析に有用な距離空間を、古代ギリシャの幾何学者ユークリッドにちなんでユークリッド空間(Euclidean space)といいます。この空間は、距離を測るために生成された$n$ 次元の実数空間$\mathbb{R}^n$です。

この空間内の距離の測りかたとしてひろく知られているのが、いわゆる2乗してルートをとる三平方の定理です。たとえば、座標平面上の原点と$P(1, 2)$の距離は

$$\sqrt{(1-0)^2+(2-0)^2}=\sqrt{5}$$

一般に、$\mathbb{R}^n$に置かれた2点$\boldsymbol{x}, \boldsymbol{x'}$の距離は

$$d=\sqrt{(x_1-x'_1)^2+(x_2-x'_2)^2+…+(x_n-x'_n)^2}$$


距離の定義
この測りかたが距離の定義を満たしていることを確認しましょう。以前の記事に書いた距離の定義を再掲します。

集合$X$から取り出した要素$x_1, x_2, x_3$の距離 $d$ が次の条件を満たすとき、これを距離空間という。

  1.  すべての $x_1, x_2$ について、$0\leq d(x_1, x_2)<\infty$
  2.  $x_1=x_2$ と $d(x_1, x_2)=0$ は同値である
  3.  $x_1\neq x_2$ であるとき $d(x_1, x_2)=d(x_2, x_1)$
  4.  $d(x_1, x_3)\leq d(x_1, x_2)+d(x_2, x_3)$

これらの条件を満たしているか、1つずつ確かめましょう。

まず1つめですが、$d$ に入る数はすべて実数であり、そのすべてを2乗して足していますので、負値は取り得ません。よって$d$ は非負です。$d$ の値が無限に発散しないためには有界性を示さなければなりませんが、私の能力を超えます。ただ、無限の距離を持つものは、そもそも考慮の対象外とするのが自然です。

2つめは、同じ座標に置かれた2点の距離は0であり、距離が0であれば2点は同じ座標に置かれているということです。座標平面に置かれた2点 $P(1, 2)$と$Q(1, 2)$を例にしましょう。これら2点間の距離は、次のように0であることがわかります。

$$PQ=\sqrt{(1-1)^2+(2-2)^2}=0$$

この式の計算結果が0であるのは、ルートの中の各項の引き算の値がすべて0であるときだけです。そして、各項の引き算の値が0になるのは、各項の2つの数がまったく同じ値をとるときだけです。これは2点の座標がまったく同じであることを意味します。

3つめは、こちらからあちらへの距離と、あちらからこちらへの距離は同じであるということです。これはルートの中の各項が2乗されていることから明らかです。上でみた2点$O(0, 0)$と$P(1,2)$を例に式で確かめてみましょう。わざわざ式を書くまでもありませんが…

$$OP=\sqrt{(1-0)^2+(2-0)^2}=\sqrt{5}$$
$$PO=\sqrt{(0-1)^2+(0-2)^2}=\sqrt{5}$$

4つめはいわゆる三角不等式と呼ばれているものです。真っ直ぐゴールへ突き進む距離より、途中でどこかへ立ち寄る距離の方が長いという、これも単純明快なものです。上に掲げた不等式の左辺と右辺にユークリッド距離を代入してみましょう。

 $$左辺=\sqrt{(x_1-x_3)^2}  右辺=\sqrt{(x_1-x_2)^2}+\sqrt{(x_2-x_3)^2}$$

それぞれ2乗すると

 $$左辺=(x_1-x_3)^2  右辺=\left(\sqrt{(x_1-x_2)^2}+\sqrt{(x_2-x_3)^2}\right)^2$$

左辺を若干書き換えて展開すると

$$左辺=((x_1-x_2)+(x_2-x_3))^2=(x_1-x_2)^2+(x_2-x_3)^2+2(x_1-x_2)(x_2-x_3)$$

右辺を展開すると

 $$右辺=(x_1-x_2)^2+(x_2-x_3)^2+2\sqrt{(x_1-x_2)^2}\sqrt{(x_2-x_3)^2}$$

左辺と右辺の違いは第3項だけです。よく見ると、左辺と右辺それぞれの第3項について、係数2を除いて2乗したものの比較はコーシー=シュワルツの不等式そのものです。すなわち

$$((x_1-x_2)(x_2-x_3))^2\leq(x_1-x_2)^2(x_2-x_3)^2$$

定義どおりに$左辺\leq 右辺$が示されました。2乗してルートをとる三平方の定理は距離空間の定義をすべて満たすことがわかりました。この測りかたをする距離空間をユークリッド空間といいます。