Processing math: 0%

2024年5月27日

有限加法性、完全加法性、完備化(Probability Theory)

※私は数学者ではありません。自分用のまとめとしてこれを書いています。楽しむ範囲でご覧いただければ幸いです。内容の正確性については専門家のサイトや動画、あるいは専門書で必ず確認をお願いします。


*  *  *


「閉じている」について
「閉じている」という数学の用語があります。これは、ある集合から任意に取り出した要素に何らかの演算をほどこした結果も、もとの集合の要素であることを意味します。

たとえば、自然数\mathbb{N}=\{1, 2, 3, …\}は、足し算と掛け算で閉じています。自然数の集合から2と3を取り出し、足し算をすると

2+3=5

計算結果は5です。5は明らかに自然数です(5\in\mathbb{N})。自然数の集合から4と5を取り出し、掛け算をすると

4\times 5=20

計算結果は20です。20は明らかに自然数です(20\in\mathbb{N})。このように集合内の要素に演算をほどこした結果がもとの集合の要素であることを閉じているといいます。


有限加法性
有限個の和について閉じている集合の集まりを有限加法族といいます。フォーマルに表現すると、次の条件すべてを満たす集合族\mathcal{F}有限加法族(finitely additive family)といいます。

  1. \varnothing\in\mathcal{F}
  2. A\in\mathcal{F} \implies A^c\in\mathcal{F}
  3. \{\boldsymbol{A_j}\}_{j=1}^J\subset\mathcal{F} \implies \bigcup_{j=1}^{J}A_j\in\mathcal{F}

前回例として挙げた\mathcal{F}=\{\Omega, \varnothing, 表, 裏\}は有限加法族です。まず、\varnothing\mathcal{F}に属していますので、条件1を満たしています。つづいて、表の補集合である裏と\varnothingの補集合である\Omegaがいずれも\mathcal{F}に属していますので、条件2を満たしています。さいごに、表と裏の和集合である{表, 裏}、すなわち\Omega\mathcal{F}に属していますので、条件3を満たしています。よって、この例は有限加法族であることが確かめられました。

有限加法族上の測度を有限加法的測度といいます。有限加法的測度には次のような性質があります。A, B\mathcal{F}の任意の要素とします。

  1. 0\leq m(A)\leq\infty
  2. m(\varnothing)=0
  3. A\cap B=\varnothing \implies m(A\cup B)=m(A)+m(B) 

性質3は、\mathcal{F}の任意の要素が互いに素であるとき、それらの和集合の測度は集合の測度の和に等しいことを表しています。これを有限加法性といいます。

用語は難しいのですが、コイントスの例を用いて説明すれば、表か裏が出る確率(=1)は、表が出る確率(0.5)と裏が出る確率(0.5)の和(=1)に等しいということです。サイコロを振って偶数の目が出る確率(0.5)は、2が出る確率(1/6)、4が出る確率(1/6)、6が出る確率(1/6)の和(=0.5)に等しいということです。

有限加法的測度は、確率が持つべき好ましい性質を持っています。


ホップの拡張定理
1回のコイントスや1回のサイコロ振りは、比較的単純な例です。より複雑な事象を分析するときには、有限個の要素からなる有限加法族を、可算無限個の要素からなる完全加法族(σ加法族)に拡張しておくと便利です。この拡張をしたのがホップ(E.F.F. Hopf:1902-1983)という人です。

彼が示したのは、有限加法的測度 m が完全加法的であれば、m を完全加法的測度 \mu に拡張できる。

という定理です。現段階では、ある条件を満たせば、慣れ親しんだコイントスやサイコロ振りの考えを、複雑な事象の分析にそのまま適用できるという理解で十分だと思います。ホップの拡張定理をふまえると、Fを実数として、その加法族上の確率を考えられるようになります。

この定理の詳細はとても難しいので、現段階ではこれだけにします。理解が深まりましたら、適宜加筆したいと思います。(伊藤清三『ルベーグ積分入門』pp.51-53、伊藤清『確率論の基礎』pp.50-54を参照。)


完全加法性
可算無限個の和について閉じている集合の集まりを完全加法族といいます。フォーマルに表現すると、次の条件すべてを満たす集合族(集合の集まり)\mathcal{F}完全加法族(σ加法族:completely additive family, σ-fieldといいます。(伊藤清三『ルベーグ積分入門』pp.29-30を参照。ただし、伊藤清『確率論の基礎』pp.1-2では、条件1は空集合ではなく全体集合となっている。空集合が\mathcal{F}に含まれることは、余事象の条件から導かれている。)

  1. \varnothing\in\mathcal{F}
  2. A\in\mathcal{F} \implies A^c\in\mathcal{F}
  3. \{\boldsymbol{A}_j\}\subset\mathcal{F} \implies \bigcup_{j=1}^{\infty}A_j\in\mathcal{F}

この完全加法族上の測度を完全加法的測度といいます(伊藤清『確率論の基礎』pp.2-3)。完全加法的測度 \muは次の性質を満たします。AA_j, A_k, j\neq k\mathcal{F}の任意の要素とします。

  1. 0\leq \mu(A)\leq\infty
  2. \mu(\varnothing)=0
  3. A_j\cap A_k=\varnothing  \implies \mu(\sum_{j=1}^{\infty}A_j)=\sum_{j=1}^{\infty}\mu(A_j) 

このように拡張された完全加法的測度を用いれば、正規分布のように、実数全体に定義域が広がる分布の確率も測れるようになります。


測度の完備化
ここまでで、確率測度を完全に定義できたように思えますが、あともう一歩が必要です。それが零集合を組み込む作業です。これまで、\mathcal{F}の要素としての零集合を気にしてきませんでした。ここでは零集合を含む完全加法族を考えます。すなわち

\mathcal{F}^*=\mathcal{F}\cup N

ここでNは零集合です。零集合とは、もとの集合の要素のうち、分析の考慮外とする要素の集まりのことです。つりがね状の形をした標準正規分布を例にすると、この分布から任意に取り出した1点、0とか0.1とか \sqrt{2}、の確率は0です。なぜかというと点の測度(長さ)は0だからです。実数上には無数の点がひしめいています。それらの測度はすべて0ですので、それらすべては零集合の要素になります。零集合にはこうしたややこしいものすべてを吸い込む魔力があります。

伊藤清『確率論の基礎』pp.10-11では、サイコロの例が紹介され、実数全体から特定の数字を除いた、とてつもなく大きな集合を零集合としています。零集合は、はじめて学ぶ私たちには窺い知れない何かのようです。測度空間の完備化について、フォーマルな説明は伊藤清三『ルベーグ積分入門』pp.43-48を参照してください。

標準正規分布のグラフをみると、0とか0.1とか\sqrt{2}のところは横軸上の線にならず、0より大きい曲線上の値をとっています。「それなのに測度0なのはおかしい」と思われるかもしれません。これは、ルベーグ積分の記事で説明していますが、関数を単関数近似してできる短冊の縦の長さ(確率論の文脈では確率密度)は確かに0ではなく正の値を持ちますが、横の長さが測度0であるため、掛け算をした結果が0になることを意味します。つまり

短冊の縦の長さ\times 0(横の長さ:零集合の測度)=0

横の長さが0なので、縦の長さ(確率密度)がどんな正の値をとっても掛け算の結果は0になります。横の長さが点ではなく、わずかでも長さを持つ線分になると、測度は正の値をとります。よって掛け算の結果も正の値をとります。短冊の横を、点でも線分でも直線でも、もとの集合\Omegaの要素であれば、なんでも評価できるようにする作業を完備化といいます。

もうひとつ、-\infty+\inftyの測度も0とすることで、実数と\pm\inftyをベースとした完全加法族についても測度を測ることができるようになります。


*  *  *


零集合を含まない\{\Omega, \mathcal{F}, \mu\}\muを、完備でないボレル集合族上のルベーグ測度、零集合を含む\{\Omega, \mathcal{F}^*, P\}Pを、ルベーグ可測集合族上のルベーグ測度といいます。(原啓介『測度・確率・ルベーグ積分』講談社, 2018, p.29)

有限加法的測度から完全加法的測度へ、完全加法的測度からルベーグ測度へと少しずつ拡張することによって確率を議論する土壌が整いました。


2024年5月26日

確率とは(Probability Theory)

※私は数学者ではありません。自分用のまとめとしてこれを書いています。楽しむ範囲でご覧いただければ幸いです。内容の正確性については専門家のサイトや動画、あるいは専門書で必ず確認をお願いします。


*  *  *


「コインを投げて表が出る確率は2分の1」とか「サイコロを振って3が出る確率は6分の1」くらいが私たちの多くにとっての確率です。それで「確率なんて簡単!、高校でもちょっとやったし」と思いがちです。

ただ、数学的には、これまで書いてきた集合論、測度論、そのほかたくさんの土台となる知識があってはじめて論じられる話題のようです。その意味では、現段階でこのトピックを取り扱うのは無謀極まりないのですが、文系による個人ブログということで大目にみていただければ幸いです。(文系を免罪符にしてはいけませんが…)


*  *  *


ラプラスの確率
「10回くじを引けば1回当たりが出る」とか「2回コイントスをすれば1回表が出る」というのは、同様に確からしい試行を繰り返して何回成功するかというある種の相対頻度です。

数学者・天文学者のラプラス(Pierre-Simon Laplace:1749-1827)は確率というものをおおよそこのように考えました。素朴とも言えますが私たちの多くにとって自然に感じられる考え方です。

参考資料


未解明の生起メカニズムをブラックボックスとして、その結果だけを問題にすると、偶然の要素が作用したようにみえます。その作用を相対頻度で数値化したものが古典的な意味での確率です。

ラプラスが生きた18世紀の中頃から19世紀のはじめは近代科学の黎明期でした。当時は、各学問領域に仮置きされているブラックボックスの中身が解明されれば確率の意義は薄れてゆくと考えられていました。そうした科学にとって希望に満ちた時代を象徴するのがラプラスの悪魔という言葉です。

ラプラスが『確率の解析的理論』の中に書き記したことに尾ひれがついてひろまったこの言葉の意味は、すべてのブラックボックスが解明されれば、確率的にみえることが実は確定的であることがわかり、世界の全てがわかるはずだということです。

面白いことに、科学が発展して起きたのは、確率の意味が薄れることではなく、確率の意義が高まることでした。高まる意義に応えるべく確率概念を定式化したのがコルモゴロフ(1903-1987)です。


コルモゴロフの確率
コルモゴロフが定式化した確率論は、数学的な道具で記述されます。皮肉なことに、これが私たちを確率論から遠ざけることにもなりました。確率論のテキストのはじめに(\Omega, \mathcal{F}, P)という表記が登場します。この記号を見た大半の人は、「確率論は難しすぎる」と学びをやめてしまいます。私も長らくこれが何かわかりませんでした。現時点での理解ですが、(\Omega, \mathcal{F}, P)はおおよそ次のような意味を持つようです。

\Omega:「オメガ」と読むこれは、起こりうるすべてのことを集めたものです。たとえば、コイントスをすると表か裏が出ます。「表が出る」とか「裏が出る」ということは、それ以上細かく場合分けできません。そうしたものを根元事象(elementary event)標本(sample)といいます。そして、根元事象をすべて集めたものを全事象(sure event)といいます。

\mathcal{F}:これは加法族といわれるものです。加法族とは、\Omegaをベースにした全事象、余事象、和事象を含む集合の集まりのことです。コイントスの例を用いると、全事象とは

\Omega=\{表, 裏\}

です。余事象とはではないほうのことです。たとえば、全事象\Omegaの余事象は

\Omega^c=\varnothing

です。\Omegaの右上にあるcは、余事象(complementary event)を表すマークです。\varnothingは空集合です。コイントスをして表か裏が出ることを全事象としたとき、その余事象はコイントスをして表も裏も出ない、つまり何も起きないということです。何も起きないことを記号\varnothingで表します。同様に、「表が出る」の余事象は「裏が出る」であり、「裏が出る」の余事象は「表が出る」です。

和事象とは、2つ以上の根元事象のいずれかが起きることを意味します。「表が出る」と「裏が出る」という2つの根元事象の和は

表\cup 裏

と表記します。\cupは事象の和を表します。全事象、余事象、和事象すべてを含む集合の集まりは

\{\Omega, \varnothing, 表, 裏, \{表, 裏\}\}

この例では\Omega= \{表, 裏\}ですので、これを\Omegaで代表させると

\mathcal{F}=\{\Omega, \varnothing, 表, 裏\}

\mathcal{F}の要素は4つです。要素が有限個であることから、これを有限加法族といいます。一般に、有限加法族の要素の数は2の根元事象乗(2^{\Omega})だけあります。この例では根元事象は2つですので、有限加法族の要素の数は2^2=4個です。

P:これは\mathcal{F}の要素すべてに付される確率を意味します。すべての事象に付けられた値だと考えてください。コイントスの例では

P(\Omega)=1, P(\varnothing)=0, P(表)=\frac{1}{2}, P(裏)=\frac{1}{2}

全事象\Omegaの確率を1とすると、それ以外の事象の確率を直感的に掴みやすくなります。全体を1(100%)とすることで、確率20%とか60%とか、わかりやすく確率を評価できます。何かが起こる確率が100%なのであれば、何も起きない確率は0です。これがP(\varnothing)=0という表記です。

また、根元事象は互いに素ですので、根元事象の和事象の確率は各根元事象の確率の和に等しくなります。ここに加法族の加法の意味があります。すなわち

P(表\cup 裏)=P(表)+P(裏)=\frac{1}{2}+\frac{1}{2}

すべての根元事象の和事象の確率は1になります。この例の根元事象は「表が出る」と「裏が出る」の2つですので、これら2つの和事象の確率は1になります。確認のために式を書くと

P(表\cup 裏)=P(\Omega)=1

私たちが日常使う「確率」という言葉を、数学ではここまで細かく定義します。また少しずつ確率のはなしを書いてゆければと思います。


2024年5月20日

単調収束と優収束の定理(Lebesgue Measure)

※私は数学者ではありません。自分用のまとめとしてこれを書いています。楽しむ範囲でご覧いただければ幸いです。内容の正確性については専門家のサイトや動画、あるいは専門書で必ず確認をお願いします。


*  *  *


数学者でない私たちにとっての測度のはなしは、終わりに近づいてきました。今回は単調収束定理と優収束定理を紹介します。


単調収束定理
ボレル集合\mathcal{B}の部分集合E上の可測な非負関数fを考えます。この関数の増加列0\leq f_1\leq f_2\leq f_3, …fに収束するとき、次式が成り立つことを単調収束定理(monotone convergence theorem)といいます。

\int_{E}fd\mu =\lim_{j\rightarrow\infty}\int_{E}f_jd\mu

この定理はおおよそ次のように確かめられます。まず、関数列が単調増加で収束することから、任意のf_jの値は収束先以下となります。すなわち

f_j\leq f

となります。測度の単調性から、両辺をEの範囲でルベーグ積分しても不等号が保たれます。

\int_E f_j d\mu\leq \int_E f d\mu

さらに、\lim_{j\rightarrow\infty}\sup f_j=fより、左辺の上極限をとっても不等号が保たれます。

\lim_{j\rightarrow\infty}\sup\int_E f_j d\mu\leq \int_E f d\mu

ファトゥの補題から

\lim_{j\rightarrow\infty}\inf\int_E f_j d\mu\geq \int_E f d\mu

\lim\inf\leq\lim\supに注意して2式をまとめると

\int_E f d\mu\leq\lim_{j\rightarrow\infty}\inf\int_E f_j d\mu\leq\lim_{j\rightarrow\infty}\sup\int_E f_j d\mu\leq \int_E f d\mu

最左と最右ではさみうちされていることから、これらはすべて等号で結ばれます。関数列が収束するということは

\lim_{j\rightarrow\infty}\inf\int_E f_j d\mu =\lim_{j\rightarrow\infty}\sup\int_E f_j d\mu =\lim_{j\rightarrow\infty}\int_E f_j d\mu

よって

\int_E f d\mu=\lim_{j\rightarrow\infty}\int_{E}f_jd\mu


有界収束定理と優収束定理
関数列が単調増加でないとき、追加の条件がないと単調収束定理のような結論は得られません。具体的には、優関数という積分可能な関数で関数列が上から抑えられるという条件を加える必要があります。積分可能な優関数によって上から抑えられている関数列の任意の要素f_jとその各点収束先であるfは、いずれも積分可能な可測関数となります。

少しフォーマルに書くと、ボレル集合\mathcal{B}の部分集合E上の関数列の任意の要素の絶対値が優関数の値(F)以下であるとき、すなわち

|f_j|\leq F

であるとき

\int_{E}fd\mu =\lim_{j\rightarrow\infty}\int_{E}f_jd\mu

が成り立つ、というのが有界収束定理です。有界収束定理における上限は定数ですが、これを異なる値を取りうるfという関数に置き換えたものを優収束定理(dominated convergence theorem)、またはルベーグの収束定理といいます。これらはある種、有界な数列は収束するという数の世界の大原則を関数の世界に拡張したものです。

ただ、証明の詳細等については込み入ります。現段階ではtoo muchですので、また機会があれば加筆したいと思います。ルージンの定理、エゴロフの定理、フビニの定理(豆腐の体積の易しい求め方)、ラドン・ニコディムの定理(条件付期待値の定式化)なども、はじめて学ぶ私たちには荷が重すぎますね…


*  *  *


ほとんどいたるところ
測度論や確率論の本を読んでいると、ほとんどいたるところとか a.e. という表記をみかけます。これはalmost everywhereのことで、零集合を除いた測度が正の集合についてという意味です。ルベーグ積分では、関数の挙動が奇妙になるところを零集合に押し込み、それ以外のお行儀のよいところにだけ正の測度を与え、積分のベースにします。

リーマン積分との違いとして、リーマンは縦に切り、ルベーグは横に切るという、見た目の違いが強調されることが多いです。また、リーマン積分できない変な関数も積分できることが強調されることもあります。

こうした紹介は若干ミスリーディングに感じます。ルベーグは定義域の一部を零集合に押し込めるトリックを思いつき、このトリックによってより柔軟な測度の概念で積分を眺められるようになったことを強調すべきだと思います。これを、志賀浩二『ルベーグ積分30講』p.183は「リーマン積分からルベーグ積分への移行は、積分という観点に立ったとき、連続関数の '完備化' であったという見方もできるのである」と書いています。

高木貞治『解析概論』p.430は、「Lebesgueは一片の咒語 'ほとんど' をもって、彼の積分論に魅惑的な外観を与ええたのであった」と a.e. のことを評価しています。この一節は志賀浩二『ルベーグ積分30講』p.169にも引用されています。



2024年5月19日

単関数とルベーグ積分(Lebesgue Measure)

※私は数学者ではありません。自分用のまとめとしてこれを書いています。楽しむ範囲でご覧いただければ幸いです。内容の正確性については専門家のサイトや動画、あるいは専門書で必ず確認をお願いします。


*  *  *


複雑な形をしたグラフを近似するツールが単関数(simple function)です。これは、グラフを横棒で近似するものです。まずはこちらの図とかこちらの図をご覧ください。単関数のおおまかなイメージが持てると思います。

原啓介『測度・確率・ルベーグ積分』講談社 は多くの人が手に取る専門書です。このp.43に「ルベーグ積分を定義する戦略は、単関数に対して積分を定義しておいて、一般の関数については単関数による近似の極限で積分を定義することである」とあります。ルベーグ積分の導入のしかたにはさまざまあると思いますが、「なるほど、そうか!」と私の心に最も響いたのはこの一文でした。


*  *  *


単関数
では、単関数の定義域と値域を定義しましょう。次のように、互いに素なJ個の部分集合に分割できる集合Eを定義域とします。Eは全体集合Xの部分集合とします。

E=E_1\cup E_2\cup E_3\cup…\cup E_J

すべてのj\neq kについてE_j\cap E_k=\varnothingです。そして、次のようなJ個の値からなる集合を値域とします。

\{a_1, a_2, a_3, …, a_J\}

すべての j についてa_j<a_{j+1}であり、0\leq a_j\leq\inftyとします。このとき、単関数とは

\phi(x)=a_1m(E_1)+a_2m(E_2)+a_3m(E_3)+…+a_Jm(E_J)

つまり

\phi(x)=\sum_{j=1}^J a_jm(E_j)

ここで、m(E_j)x\in E_jのとき1、x\notin E_jのとき0をとる定義関数(indicator function)です。\phi(x)x\in E_jであるときにだけa_jの値をとり、x\in E_kであるときにだけa_kの値をとります。つまり、\phiは定義域の部分と値域の値が対応する関数だということです。

このように定義される\phiは横棒が階段状につづくグラフになることから階段関数(step function)ともいいます。この不思議な関数を用いて、ルベーグは新たな積分(面積の求め方)を提案しました。


ルベーグ積分
ボレル集合族\mathcal{B}の部分集合E上の非負関数f(E)についてルベーグ積分を定義しましょう。

\int f d\mu=\lim_{J\rightarrow\infty}\sum_{j=1}^J a_j\mu(E_j)

左辺はルベーグ積分の記法であり、右辺は左辺の意味を表しています。右辺の\muの中にあるE_jE_j=f^{-1}(\{a_j\})です。これは関数fの逆像です(引き戻し)。値域の値をa_jとしたとき、その入力元となる定義域の値がf^{-1}(\{a_j\})です。私たちになじみのある言葉にすると「xの値」になります。

したがって、\mu(f^{-1}(\{a_j\}))は「xの値」の測度です。この測度を横の長さとして、縦の長さを対応するa_jとしたとき、長方形ができます。この長方形の面積を各 j について計算し、J個足し合わせるというのが \sumです。これにより「関数f(x)の下の面積」を、さまざまな高さと幅の長方形の面積の合計によって近似できます。

そして、値域の分割を限りなく細かくしてゆくと、「関数f(x)の下の面積」と無数の長方形の面積の合計がぴったり一致します。これが \lim_{J\rightarrow\infty}です。このように積分しよう、というのがルベーグ積分です。

定義域のうち、変なところを可測であるが測度0と評価することによって(正の測度を持つ部分集合と零集合に分割して)考慮外とし、お行儀のよいところだけ(正の測度を持つ部分集合だけ)値を与える(a_jと掛け合わせる)ことで「お行儀のよい長方形」を作り、それを足し合わせて面積としようというのがルベーグの考えです。


*  *  *


全体を極小の部分に分割し、全体を鮮やかに再構成する作法はフランスの根底を流れる思想だと感じます。カトリック教会のステンドグラスを通じで床に降り注ぐ光は、まさに関数の逆像です。

ルベーグより少し早く生まれた経済学者のワルラス(1834-1910)は極小無数の消費者と生産者が出会う場としての市場を分析しました。また画家のスーラ(1859-1891)は、点描の技法を確立しました。1875年生まれのルベーグは、こうした知的空気感の中で着想を得たのかもしれません…


*  *  *


ルベーグ積分の存在
この積分が存在することは、関数f(x)を上下から単関数で挟み込むことによって確認できます。関数f(x)を上から抑える単関数を上積分といいます。上積分\int^* f d\mu

\int^* f d\mu=\inf\left\{\int gd\mu | f\leq g すべての  x\in E\right\}

そして、下積分\int_* f d\mu

\int_* f d\mu=\sup\left\{\int gd\mu | f\geq g すべての  x\in E\right\}

上2式の\int gd\muは非負の値をとる単関数です。上積分=下積分のとき、ルベーグ積分の値が存在します。そして、その値が無限大に発散しないとき(\mathbb{R}_+に収まるとき)、積分可能(可積分)といいます。


*  *  *


このような話をするために、測度、可測集合、可測関数、正則、σ加法族、ボレル集合など細かい道具立てをそろえる必要があります。ここまで来ると、「ああ、このためだったのか」という感じになるのではないでしょうか。ボレル集合を知るためには、位相の知識が必要ですね… また少しずつ学んでみたいと思います。


2024年5月18日

上極限と下極限(Lebesgue Measure)

 ※私は数学者ではありません。自分用のまとめとしてこれを書いています。楽しむ範囲でご覧いただければ幸いです。内容の正確性については専門家のサイトや動画、あるいは専門書で必ず確認をお願いします。


*  *  *


前回ファトゥの補題を概観したとき、上極限と下極限についておざなりにしてしまいました。この記事では、これらについて詳しくみます。

この記事は、以下のリンクを参照して作成しました。(理解の不十分さはすべて私の責任です。)


*  *  *


集合の積と和
複数の集合いずれにも入っている要素の集まりを集合のといいます。集合の記法を用いて表すと、2つの集合ABの積は

A\cap B

抽象的でわかりにくいので、具体例を挙げます。ABをそれぞれ次のようにおきます。

A=\{1, 2, 3, 4\}  B=\{3, 4, 5, 6\}

ABいずれにも入っている要素を集めると

A\cap B=\{3, 4\}

複数の集合に共通する要素を抜き出していますので、積は共通部分ともいいます。これに対して、複数の集合のいずれかに入っている要素の集まりを集合のといいます。2つの集合ABの和は次のように表記します。

A\cup B

ABのいずれかに入っている要素を集めると

A\cup B=\{1, 2, 3, 4, 5, 6\}

となります。積を表す記号\capはcap🧢とも読み、選ばれたものだけが入るイメージです。和を表す記号\cupはcup☕️とも読み、すべてが入るイメージです。


集合族の積と下極限
集合を並べたものを集合族といいます。たとえば、次のように集合を10個並べたものは集合族です。

\{A_1, A_2, A_3, …, A_{10}\}

ここでは、次の3つの集合からなる族を考えます。

A_1=\{3\}  A_2=\{3, 4\}  A_3=\{3, 4, 5\}

A_1A_2に含まれ、A_2A_3に含まれます。入れ子構造になっていますね。これを集合論の記法で書くと

A_1\subset A_2\subset A_3

となります。まずはA_2A_3の積をみましょう。

A_2\cap A_3=\{3, 4\}

2つの集合のいずれにも入っているのは3と4です。5はA_2に含まれませんので、積集合の要素になりません。つづいて、A_1A_2A_3の積をみましょう。上で求めたA_2\cap A_3を用いると

A_1\cap(A_2\cap A_3)=\{3\}\cap\{3, 4\}=\{3\}

A_1A_2\cap A_3のいずれにも入っているのは3だけです。4はA_1に含まれませんので、積集合の要素になりません。よって、3つの集合の積は

A_1\cap A_2\cap A_3=\{3\}

まとめると

式1 A_1\cap A_2\cap A_3=\{3\}
式2 A_2\cap A_3=\{3, 4\}
式3 A_3=\{3, 4, 5\}

集合3つのとき要素は1つ、集合2つのとき要素は2つ、集合1つのとき要素は3つです。興味深いことに、積をとる集合の数が減るにしたがい要素の個数は増えます。式1, 2, 3の和集合をとると

\{3\}\cup\{3, 4\}\cup\{3, 4, 5\}=\{3, 4, 5\}

これを集合の記法を用いておしゃれに書くと

\bigcup_{j=1}^3\bigcap_{k=j}^3 A_k=\{3, 4, 5\}

なぜこんなにコンパクトに書けるのか、確かめましょう。まずj=1のとき、k は1から3まで1, 2, 3の値をとります。3つの集合の積をとりますので、式1になります。つづいてj=2のとき、k は2から3まで2と3の値をとります。後ろ2つの集合の積をとりますので、式2になります。 j=3のとき、k は3だけをとります。これはA_3そのものですので、式3となります。上式は式1, 2, 3の和集合ですので

\bigcup_{j=1}^3\bigcap_{k=j}^3 A_k=式1\cup 式2 \cup 式3
=\{3\}\cup\{3, 4\}\cup\{3, 4, 5\}=\{3, 4, 5\}

となり、表記法が正しいことがわかりました。ここでは集合が3つの例を考えましたが、集合族を集合列(可算無限個の集合を並べたもの)に拡張すると

\bigcup_{j=1}^{\infty}\bigcap_{k=j}^{\infty} A_k

この式の\bigcap_{k=j}^{\infty}は積をとることを意味しています。可算無限個ある集合のいずれにも入っている要素だけを取り出して作る集合は、ある種最小の集合とみることができます。解析の記法では、最小を下限(\inf)と書きます。

\bigcup_{j=1}^{\infty}は、下限を求める作業を1つめの集合から、2つめの集合から、3つめの集合から、…と無限に繰り返すことを意味しています。解析の記法では、添字を無限に飛ばすことを極限(\lim)といいます。よって、集合の記法は、次のように解析の記法に置き換えられます。

\bigcup_{j=1}^{\infty}\bigcap_{k=j}^{\infty} A_k=\lim_{j\rightarrow\infty}\inf A_j

j=3までの例では集合の要素が1つずつ増えていますが、jが100とか1000になると集合の要素は増えなくなり、そのまま変わらなくなるかもしれません。そのような行先の集合を下極限といいます。私たちが数列の下極限で持っていたイメージと比べて、かなり抽象度が高いですよね…


集合族の和と上極限
上のlim infと対照をなすのが、lim supです。先ほどと同じ3つの集合からなる族を例に考えます。

A_1=\{3\}  A_2=\{3, 4\}  A_3=\{3, 4, 5\}

まずはA_2A_3の和をみましょう。和とは2つの集合のいずれかに入っている要素を集める作業ですので

A_2\cup A_3=\{3, 4, 5\}

この結果を用いて、A_1A_2A_3の和をとりましょう。

A_1\cup(A_2\cup A_3)=\{3\}\cup\{3, 4, 5\}=\{3, 4, 5\}

よって、3つの集合の和は

A_1\cup A_2\cup A_3=\{3, 4, 5\}

まとめると

式1 A_1\cup A_2\cup A_3=\{3, 4, 5\}
式2 A_2\cup A_3=\{3, 4, 5\}
式3 A_3=\{3, 4, 5\}

下極限のときとは異なり、Aが3つのとき、2つのとき、A_3だけのとき、すべてについて要素は3つです。式1, 2, 3の積をとると

\{3, 4, 5\}\cap\{3, 4, 5\}\cap\{3, 4, 5\}=\{3, 4, 5\}

これを集合の記法を用いて書くと

\bigcap_{j=1}^3\bigcup_{k=j}^3 A_k=\{3, 4, 5\}

この表記についても確認してみます。まずj=1のとき、k は1から3まで1, 2, 3の値をとります。3つの集合の和をとりますので、式1になります。つづいてj=2のとき、k は2から3まで2と3の値をとります。後ろ2つの集合の和をとりますので、式2になります。j=3のとき、k は3だけをとります。これはA_3そのものですので式3となります。上式は式1, 2, 3の積集合ですので

\bigcap_{j=1}^3\bigcup_{k=j}^3 A_k=式1\cap 式2 \cap 式3
=\{3, 4, 5\}\cap\{3, 4, 5\}\cap\{3, 4, 5\}=\{3, 4, 5\}

となります。集合族を集合列に拡張すると

\bigcap_{j=1}^{\infty}\bigcup_{k=j}^{\infty} A_k

この式の\bigcup_{k=j}^{\infty}は和をとることを意味しています。可算無限個ある集合のいずれかに入っている要素をくまなく取り出して作る集合は、最大の集合とみることができます。解析の記法では、最大を上限(\sup)と書きます。

\bigcap_{j=1}^{\infty}は、上限を求める作業を1つめの集合から、2つめの集合から、3つめの集合から、…と無限に繰り返すことを意味しています。解析の記法では、添字を無限に飛ばすことを極限(\lim)といいます。よって、集合の記法は、次のように解析の記法に置き換えられます。

\bigcap_{j=1}^{\infty}\bigcup_{k=j}^{\infty} A_k=\lim_{j\rightarrow\infty}\sup A_j

j=3までの数値例では、集合の要素が変わらないまま推移しています。もしこの状態が無限の先まで続くのであれば、これが集合の上極限になります。


下極限と上極限の関係
一般に、lim inf はlim supの部分集合です。

\lim_{j\rightarrow\infty}\inf A_j\subset\lim_{j\rightarrow\infty}\sup A_j

上に掲げたJ=3の数値例では、lim infの集合とlim supの集合が一致します。Jが無限大に向かうとき、lim infの集合とlim supの集合が一致するとき、それを極限集合(limit set)といいます。

\lim_{j\rightarrow\infty}\inf A_j=\lim_{j\rightarrow\infty}\sup A_j=\lim_{j\rightarrow\infty}A_j

極限は存在するときとしないときがありますが、上極限と下極限は必ず存在します(\pm\inftyを含めて考える場合)。それで、極限の有無を調べるツールとしてこれらの概念が使われます。


2024年5月13日

収束、上極限、下極限、ファトゥの補題(Lebesuge Measure)

※私は数学者ではありません。自分用のまとめとしてこれを書いています。楽しむ範囲でご覧いただければ幸いです。内容の正確性については専門家のサイトや動画、あるいは専門書で必ず確認をお願いします。


*  *  *


前回、σ加法族を紹介しました。今回はファトゥの補題を紹介します。これはとてつもなく難しいものですので、大まかなイメージを持てるところまでを目標にします。


収束と極限
数列の先のほうの値が変わらなくなるとき、収束する(converge)といいます。たとえば

2+\left(-\frac{1}{2}\right)^j

という数列を書き表すと

\left\{2+\left(-\frac{1}{2}\right)^1, 2+\left(-\frac{1}{2}\right)^2, 2+\left(-\frac{1}{2}\right)^3, …\right\}

この数列は、2を境に上下しながら限りなく2に近づいてゆきます。このとき、この数列は2に収束するといいます。数列には、収束せずに発散する(diverge)ものや振動したまま(oscillate)のものもありますがこの記事では有限な値に収束する数列について考えます。また、数列を集合に見立てたA_jはすべての j について可測とします。


上極限と下極限
数列が収束するとき、その数列の一部を抜き出して作成した部分列も収束します。そのようすをみるものを上極限といいます。上の数列を例にしましょう。もとの数列は

\left\{2+\left(-\frac{1}{2}\right)^1, 2+\left(-\frac{1}{2}\right)^2, 2+\left(-\frac{1}{2}\right)^3, …\right\}

これは2に収束します。この数列から偶数番の要素だけ取り出すと

\left\{2+\left(-\frac{1}{2}\right)^2, 2+\left(-\frac{1}{2}\right)^4, 2+\left(-\frac{1}{2}\right)^6, …\right\}

これは最小上界(上限)が上から2に向かい収束します。この数列から4の倍数番の要素だけ取り出すと

\left\{2+\left(-\frac{1}{2}\right)^4, 2+\left(-\frac{1}{2}\right)^8, 2+\left(-\frac{1}{2}\right)^{12}, …\right\}

これも最小上界(上限)が上から2に向かい収束します。このように、もとの数列から作成した部分列の収束先は、もとの数列の収束先と同じことを確かめられます。これは、各部分列の最小上界(上限)を集めてその極限をとる作業ですので、次のように表記できます。

a^*=\lim_{j\rightarrow\infty}\sup A_j

同様に、減衰曲線の下からの収束をみるときには、各周期の極小値からなる部分列を作り、そのようすをみるのが賢明です。たとえば、奇数番だけ取り出すと

\left\{2+\left(-\frac{1}{2}\right)^1, 2+\left(-\frac{1}{2}\right)^3, 2+\left(-\frac{1}{2}\right)^5, …\right\}

これは最大下界(下限)が下から2に向かい収束します。各部分列の最大下界(下限)を集めてその極限をとる作業は、次式のように表記できます。a_*下極限です。

a_*=\lim_{j\rightarrow\infty}\inf A_j

上極限と下極限が存在するとき、次の式が成り立ちます。

\lim_{j\rightarrow\infty}\inf A_j\leq\lim_{j\rightarrow\infty}\sup A_j

上極限a^*と下極限a_*が等しいとき、極限が存在するといいます。このとき、上の不等式は等号で成り立ちます。


集合の記法
集合の記法で上極限を表してみましょう。上の例を再び掲げると

A_1=\left\{2+\left(-\frac{1}{2}\right)^1, 2+\left(-\frac{1}{2}\right)^2, 2+\left(-\frac{1}{2}\right)^3, …\right\}
A_2=\left\{2+\left(-\frac{1}{2}\right)^2, 2+\left(-\frac{1}{2}\right)^4, 2+\left(-\frac{1}{2}\right)^6, …\right\}
A_3=\left\{2+\left(-\frac{1}{2}\right)^4, 2+\left(-\frac{1}{2}\right)^8, 2+\left(-\frac{1}{2}\right)^{12}, …\right\}

A_1の最小上界は2+\left(-\frac{1}{2}\right)^2A_2の最小上界は2+\left(-\frac{1}{2}\right)^2A_3の最小上界は2+\left(-\frac{1}{2}\right)^4です。これらのうち最小の2+\left(-\frac{1}{2}\right)^4A_3の要素ですが、A_1の要素でもあり、A_2の要素でもあります。すなわち

2+\left(-\frac{1}{2}\right)^4\in A_1\cup A_2\cup A_3

であり、かつ

2+\left(-\frac{1}{2}\right)^4\in A_1\cap A_2\cap A_3

また同様に

2+\left(-\frac{1}{2}\right)^4\in A_2\cup A_3

であり、かつ

2+\left(-\frac{1}{2}\right)^4\in A_2\cap A_3

さらに

2+\left(-\frac{1}{2}\right)^4\in A_3

つまり、収束先の候補は、最小上界の候補となる集合をすべて集め、そのいずれにも入っている要素だということになります(簡単化のためにこのようになる部分列を作成しました)。集合の記法では、候補をすべて集めることを\bigcupで、いずれにも入っていることを\bigcapで表します。よって

収束先の候補=2+\left(-\frac{1}{2}\right)^4\in A_3\subset\bigcap_{j=1}^{3}\bigcup_{n=j}^{3}A_n

調べる集合の数を増やすにしたがい、収束先の候補が絞り込まれるイメージです。3を3より大きいJに一般化すると、候補はさらに絞られます。

A_J\subset\bigcap_{j=1}^{J}\bigcup_{n=j}^{J}A_n

測度の単調性から

\mu(A_J)\leq\mu\left(\bigcap_{j=1}^{J}\bigcup_{n=j}^{J}A_n\right)

Jを限りなく大きくすると(記述の煩雑さを避けるためにJj に置き換えています)

\lim_{j\rightarrow\infty}\sup\mu(A_j)\leq\mu\left(\bigcap_{j=1}^{\infty}\bigcup_{n=j}^{\infty}A_n\right)

下極限は、上極限と対称をなしますので(と簡単に書くとお叱りを受けますが…)

\mu\left(\bigcup_{j=1}^{\infty}\bigcap_{n=j}^{\infty}A_n\right)\leq\lim_{j\rightarrow\infty}\inf\mu(A_j)

※集合の記法はとても難しいです。こちらを参照しました。
こちらは英語ですが、とてつもなくhelpfulです。


ファトゥの補題
ここまでの結果をまとめると、数列の上極限と下極限を集合の上極限と下極限ではさみこむことができます。すなわち、\mu(\bigcup_{j=1}^{\infty}A_j)が有限であるとき、次の不等式が成り立ちます。

\mu\left(\bigcup_{j=1}^{\infty}\bigcap_{n=j}^{\infty}A_n\right)\leq\lim_{j\rightarrow\infty}\inf\mu(A_j)
\leq\lim_{j\rightarrow\infty}\sup\mu(A_j)\leq\mu\left(\bigcap_{j=1}^{\infty}\bigcup_{n=j}^{\infty}A_n\right)

これを極限の記法で書くと

\mu(\lim_{j\rightarrow\infty}\inf A_j)\leq\lim_{j\rightarrow\infty}\inf\mu(A_j)
\qquad\qquad\leq\lim_{j\rightarrow\infty}\sup\mu(A_j)\leq\mu(\lim_{j\rightarrow\infty}\sup A_j)

この結果をファトゥの補題(Fatou's lemma)といいます。(志賀浩二『ルベーグ積分30講』p.83)

「ファトゥの補題はルベーグ積分に関するもので、集合に関するものではない」と言われるかもしれません。この後少しずつ学ぶと見えてくると思いますが、ルベーグ=カラテオドリの測度はそのままルベーグ積分です。積分の記法で書くと(志賀浩二『ルベーグ積分30講』p.155は積分表記をファトゥの不等式と呼び、単調収束定理を用いて証明しています。詳細な証明は『数の落とし子』の方が説明されています。今の私にはとても追いきれませんでしたが… こちらもあわせて参照しました。)

\int\lim_{j\rightarrow\infty}\inf f_j d\mu\leq\lim_{j\rightarrow\infty}\inf\int f_j d\mu
\qquad\qquad\leq\lim_{j\rightarrow\infty}\sup\int f_j d\mu\leq\int\lim_{j\rightarrow\infty}\sup f_j d\mu

積分は測度の一形態であるとは、ルベーグの慧眼です。


2024年5月8日

σ加法族(Lebesgue Measure)

※私は数学者ではありません。自分用のまとめとしてこれを書いています。楽しむ範囲でご覧いただければ幸いです。内容の正確性については専門家のサイトや動画、あるいは専門書で必ず確認をお願いします。


*  *  *


前回は集合族の測度についてみました。今回は、σ加法族について紹介します。

本格的に確率を学びたいと思って専門書を開くと、たいがい1ページ目にσ加法族が登場します。私たちの大半は、この用語を見た瞬間に頭が真っ白になり、開いたばかりの本を閉じ、図書館の書棚にそっと返してしまいます。この段階をなんとか超えたいな、と思います。


べき集合
集合Aの要素からなるすべての部分集合の集まりをべき集合(power set) といい、2^Aと表記します。2のA乗と書くのは、Aの要素の数がA個あるとき、べき集合の要素の数は2^A個存在するためです。

コイントスの結果、表が出ることを1、裏が出ることを2としましょう。これは、2つの要素からなる集合として表記できます。

 A=\{1, 2\}

Aのべき集合は

2^A=\{\varnothing, 1, 2, \{1, 2\} \}

確かに要素の数は2^A=2^2=4個あります。集合の要素の数が3なら8、4なら16の要素がべき集合にあります。


σ加法族
準備が整いましたので、σ加法族を定義します。集合Xのべき集合 2^X\mathcal{F}とおき、A\mathcal{F}の任意の要素とします。このとき、次の条件を満たす\mathcal{F}σ加法族(σ-field, σ-algebra)といいます。

  1. \varnothing\in\mathcal{F}
  2. A\in\mathcal{F} \implies A^c\in\mathcal{F}
  3. \{\boldsymbol{A}_j\}\subset\mathcal{F} \implies \bigcup_{j=1}^{\infty}A_j\in\mathcal{F}

1つめは、空集合が\mathcal{F}の要素であるということです。上のコイントスの例でも、べき集合の要素に空集合がきちんと入っています。

2つめは、これ\mathcal{F}の要素ならこれ以外\mathcal{F}の要素だということです。コイントスの例では「表が出る:1」と「裏が出る:2」はともに\mathcal{F}の要素です。同様に「表か裏が出る: \{1, 2\}」と表も裏も出ない、すなわち「空集合:\varnothing」はともに\mathcal{F}の要素です。

3つめは、可算無限の集合列の要素すべてが\mathcal{F}の要素なら、その和集合も\mathcal{F}の要素だということです。コイントスの例は有限集合ですが、気持ちだけ眺めると…

\{\varnothing, 1, 2, \{1, 2\} \}

のすべての要素の和集合は \{1, 2\}です。これは明らかに\mathcal{F}の要素です。

条件2と条件3を用いれば、\bigcap_{j=1}^{\infty}A_j\mathcal{F}の要素だと確かめられます。条件2から、A\in\mathcal{F}ならA^c\in\mathcal{F}です。条件3から、その和集合も\mathcal{F}の要素です。すなわち

\{\boldsymbol{A}_j^c\}\subset\mathcal{F} \implies \bigcup_{j=1}^{\infty}A_j^c\in\mathcal{F}

再び条件2から

\left(\bigcup_{j=1}^{\infty}A_j^c\right)^c=\bigcap_{j=1}^{\infty}A_j\in\mathcal{F}

σ加法族は、測る場としてよい性質を持っています。コイントスの例では、表が出る確率、裏が出る確率、表か裏が出る確率、表も裏も出ない確率、起こりうる事象すべてを確率の計測対象にできます。確率を測る場として心地よいです。

確率などを測れる場という意味で、集合Fから生成されたσ加法族\mathcal{F}可測空間(measurable space)といい、(F, \mathcal{F})と表記します。確率論の専門書によく(\Omega, \mathcal{F}, P)と書いてありますが、これは可測空間を確率測度Pで測ること意味しています。


*  *  *


σ加法族の生成
もとの集合Fからσ加法族を作成することもできます。集合Fから最小のσ加法族を作成する作業を生成(generate)といいます。集合Fから生成されたσ加法族を\sigma(F)と表記します。

上で用いたコイントスの例を少しだけ拡張してみましょう。コインを2回投げた結果は次の4とおりです。

4=\{表, 表\}
3=\{表, 裏\}
2=\{裏, 表\}
1=\{裏, 裏\}

それぞれに4から1までの番号をつけました。これらを集めた集合Fは次のようになります。

F=\{1, 2, 3, 4\}

この集合から生成されるσ加法族\sigma(\{1, 2\})

\sigma(\{1, 2\})=\{\varnothing, F, \{1, 2\}, \{3, 4\}\}

となります。これがσ加法族であることを確かめましょう。この記事のはじめに書いた3条件のうちの1つめは、空集合がσ加法族の要素であるということです。空集合は確かに\sigma(\{1, 2\})の要素です。

3条件のうちの2つめは、補集合がσ加法族の要素であるということです。ここまでで\sigma(\{1, 2\})の要素になっているのは\{\{1, 2\}, \varnothing\}です。これらの補集合はそれぞれ

\{1, 2\}^c \implies \{3, 4\}
\varnothing^c \implies F

確かにこれらも\sigma(\{1, 2\})の要素です。3条件のうちの3つめは、生成されたσ加法族のすべての要素の和集合が\sigma(\{1, 2\})の要素であるということです。

F=\varnothing\cup F\cup\{1, 2\}\cup\{3, 4\}

は明らかです。よって、3条件すべてを満たす\sigma(\{1, 2\})は集合Eから生成されたσ加法族だといえます。


*  *  *


とりかかりは、これくらいでいいかなと思います。ボレル集合族はあまりに壮大ですので…

ルベーグ測度の世界では零集合が決定的な役割を果たすように思います(志賀浩二『ルベーグ積分30講』pp.52-53)。おおげさかもしれませんが、虚数単位 i と同じくらいの役割を果たしていそうです。そのうちだんだんみえてくるでしよう…






可測集合族の測度(Lebesgue Measure)

※私は数学者ではありません。自分用のまとめとしてこれを書いています。楽しむ範囲でご覧いただければ幸いです。内容の正確性については専門家のサイトや動画、あるいは専門書で必ず確認をお願いします。


*  *  *


前回は様々な集合の可測性を調べました。今回はそのつづきです。集合の重なりがないときの測度、集合がずらりと並ぶ集合族と集合列の測度についてみます。


素集合
素(disjoint)とは、重なっていないということです。たとえば、神奈川県と秋田県は地図上で重なっていません。「この番地は神奈川県であり、秋田県でもあります」というところはないはずです。集合ABの両方に入る要素が1つもないことを互いに素といい、そのような集合を素集合(disjoint sets)といいます。式で書くと

A\cap B=\varnothing

ABが可測であるとき、素集合の測度はAの測度とBの測度の和と等しくなります。

\mu(A\cup B)=\mu(A)+\mu(B)

神奈川県と秋田県を合わせた面積は、神奈川県の面積と秋田県の面積の和に等しいという、私たちの感覚に合う結論が測度の世界でも得られます。


集合族
つづいて、集合を有限個並べ集合にしたもの\{A_1, A_2, A_3, …, A_J\}について考えます。こうしたものを集合族(familiy of sets)といいます。すべての要素が可測集合である集合族の和集合と積集合は、ともに可測です。すなわち

\bigcap_{j=1}^JA_j    \bigcup_{j=1}^JA_j

はともに可測です。すべてのj\neq kについてA_j\cap A_k=\varnothingであれば、和集合の測度は完全加法性を満たします。すなわち

\mu\left(\bigcup_{j=1}^JA_j\right)=\sum_{j=1}^J\mu(A_j)

47都道府県からなる日本国の面積は各都道府県の面積の和であるというこの結論は、私たちの感覚に合います。数学は難しいものではありますが、奇を衒った突拍子もないものではありません。大半は極めて常識的なものです。


集合列
さらに、集合を可算無限個並べた集合\{A_1, A_2, A_3, …\}に拡張しましょう。こうしたものを集合列(sequence of sets)といいます。すべてのj\neq kについてA_j\cap A_k=\varnothingであれば、可測な集合列の和の測度も完全加法性を満たします。すなわち

\mu\left(\bigcup_{j=1}^{\infty}A_j\right)=\sum_{j=1}^{\infty}\mu(A_j)

集合列の要素がどんどん大きくなるとき、すなわち、すべての j について A_j\subset A_{j+1}であるとき、単調増加な集合列といいます。この測度は最後の、つまり最大の要素の測度に収束します。

\mu\left(\bigcup_{j=1}^{\infty}A_j\right)=\lim_{j\rightarrow\infty}\mu(A_j)

ある人の居住地を最も小さな単位で表すと、「5階1号室に住んでいます」などとなります。1段階大きなくくりでは「〇〇マンションに住んでいます」、くくりを少しずつ大きくしてゆくと「△△市に住んでいます」「××県に住んでいます」「日本国に住んでいます」「地球に住んでいます」…となります。最後の一番大きなくくりにそれまでのくくりすべてが含まれています。単調増加とはこういう状況です。

単調増加な集合列と対をなすのが単調減少な集合列です。これは、要素がどんどん小さくなる、つまりすべての j についてA_{j+1}\subset A_jであるような集合列です。この測度は最後の、つまり最小の要素の測度に収束します。

\mu\left(\bigcap_{j=1}^{\infty}A_j\right)=\lim_{j\rightarrow\infty}\mu(A_j)

ただし、\mu(A_1)は有限とします(最小の要素の測度になるのだから、この条件は不要にみえますが、証明の過程で必要となります)。この式は上式とよく似ていますが、上式は和\bigcup、この式は積\bigcapであることに注意しましょう。

玉ねぎ🧅を横で輪切りにすると同心円状にリングが重なっていますよね。リングを外側から1枚ずつ取り除いてゆくと、最後に一番小さな真ん中だけが残ります。単調減少とはそんなイメージです。


2024年5月7日

空集合、全体集合、零集合、補集合、和集合、積集合の可測性(Lebesgue Measure)

※私は数学者ではありません。自分用のまとめとしてこれを書いています。楽しむ範囲でご覧いただければ幸いです。内容の正確性については専門家のサイトや動画、あるいは専門書で必ず確認をお願いします。


*  *  *


前回の記事で測度を定義しました。今回はそのつづきです。集合Xの様々な部分集合と要素の可測性を調べます。


空集合と全体集合
空集合\varnothingと全体集合Xは可測です。これは、可測性の定義式にこれらを代入してすぐ確かめられます。

\mu(E\cap \varnothing)+\mu(E-\varnothing)=\mu(\varnothing)+\mu(E)=\mu(E)
\mu(E\cap X)+\mu(E-X)=\mu(E)+\mu(\varnothing)=\mu(E)


零集合
最小の測度を持つ要素、もしくはその集まりを零集合(null set)といいます。零集合の可測性を調べてみましょう。

\mu(E\cap A)+\mu(E-A)\leq\mu(A)+\mu(E)=\mu(E)

第1項は最小の測度を持つ零集合と任意の集合の積が零集合であることから、第2項は集合から集合を引いた結果がもとの集合以下であることから、このように変形できます。最右の等式は\mu(A)=0(最小の測度は0というのが測度の基本性質)であることから得られます。上式の最左と最右に注目すると

\mu(E\cap A)+\mu(E-A)\leq\mu(E)

これは、前回紹介した可測性の弱い条件ですので、可測性が確認できました。空集合も零集合ですので可測です。


補集合
集合Xの部分集合Aに対して、Aではないものを補集合といい、A^cと表記します。いわゆる、ではないほうが補集合です。Aが可測であるとき、A^cの可測性を調べましょう。

\mu(E\cap A^c)+\mu(E-A^c)=\mu(E-A)+\mu(E\cap A)

第1項は「ではないほうと重なる」と「であるほうを除く」が同じであることから、第2項は「ではないほうを除く」と「であるほうと重なる」が同じであることから、このように変形できます。右辺の第1項と第2項を入れ替えると

\mu(E\cap A)+\mu(E-A)

これはとりもなおさず可測性の定義式です。

\mu(E)=\mu(E\cap A)+\mu(E-A)

右辺の各項を補集合の表記に戻せば、補集合の可測性が確認できます。

\mu(E)=\mu(E\cap A^c)+\mu(E-A^c)


和集合と積集合
集合Xの部分集合A, Bの和集合とは、集合AまたはBに入る要素すべての集まりであり、A\cup Bと表記します。積集合とは、集合ABの両方に入る要素すべての集まりであり、A\cap Bと表記します。和集合はまたは、積集合はかつですので

A\cap B\subset A\cup B

となります。可測である集合ABの和集合の可測性を調べましょう。可測性の定義式は

\mu(E)=\mu(E\cap A)+\mu(E-A)

Bが可測であることを用いて\mu(E-A)を測ると

\mu(E-A)=\mu((E-A)\cap B)+\mu((E-A)-B)

これを上式の右辺第2項に代入すると

\mu(E)=\mu(E\cap A)+\mu((E-A)\cap B)+\mu((E-A)-B)

右辺第3項の形を少し変えると、項の中に和集合が現れます。

\mu(E)=\mu(E\cap A)+\mu((E-A)\cap B)+\mu(E-(A\cup B))

この式を式(*)とおきましょう。右辺の第1項と第2項は、和集合の可測性の定義式の第1項 \mu(E\cap (A\cup B))と何らか比べられるべきです。少しトリッキーですが、この集合を次のように変形します。

E\cap (A\cup B)=(E\cap A)\cup(E\cap B)
\qquad\qquad\qquad\qquad=(E\cap A)\cup((E-A)\cap B)

劣加法性から

\mu(E\cap (A\cup B))=\mu((E\cap A)\cup((E-A)\cap B))
\qquad\qquad\qquad\quad\leq\mu(E\cap A)+\mu((E-A)\cap B)

これは、この式の最左辺が、式(*)の右辺第1項と第2項の和より小さいことを意味します。式(*)の右辺第1項と第2項が最右辺であれば等式が成立しますから、それより小さい左辺を代入すれば、関係は\geqになります。すなわち

\mu(E)\geq\mu(E\cap(A\cup B))+\mu(E-(A\cup B))

この式は、可測集合A, Bの和集合が可測であることの定義式です。

さいごに、可測集合A, Bの積集合の可測性を調べましょう。補集合と和集合はすでに可測であることが確かめられていますので、次のような変形から可測であることが示されます。

(A^c\cup B^c)^c=A\cap B

私たちがよくみかける集合について、可測性が確認できました。


ジョルダン、ルベーグ、カラテオドリ(Lebesgue Measure)

※私は数学者ではありません。自分用のまとめとしてこれを書いています。楽しむ範囲でご覧いただければ幸いです。内容の正確性については専門家のサイトや動画、あるいは専門書で必ず確認をお願いします。


*  *  *


前回までで、距離空間のシリーズをひとまず終えました。次のテーマとして測度とベクトル空間を候補にしたのですが、まずは測るということの理解を深めたいと思い、ルベーグ測度のシリーズにしました。


  • ルベーグ測度:測る
  • ベクトル空間:計算する


*  *  *


私たちは、日常生活の中でいろいろなものを測っています。距離を測ったり、面積や体積を測ったり、重さを測ったり、個数を測ったり、気温を測ったり、高度を測ったり、濃度を測ったり、照度を測ったり、彩度を測ったり、比率を測ったり、確率を測ったりします。こうしたことができるのは、測りかたのルールがきちんと定まっているためです。

フランス人のルベーグ(Henri Léon Lebesgue:1875-1941)という人は、測りかたを深く探究した数学者です。1789年大革命でメートル法を提唱したフランスの伝統は、この人の理論に息づいているのでしょう。

こちらの記事によれば、メートル法以前には800とおりもの測りかたがあったようです…


*  *  *


内測度と外測度
入り組んだ形をした敷地の面積を近似することを考えます。

まず、敷地の境界にかからないように有限個のタイルを敷地内側に敷き詰め、そのタイルの面積の総和で敷地面積を近似する方法があります。これを内測度(inner measure)といいます。もうひとつ、敷地の境界にほんのわずかだけかかるように有限個のタイルを敷き詰め、そのタイルの面積の総和で敷地の面積を近似する方法があります。これを外測度(exterior measure, outer measure)といいます。

内測度の上限外測度の下限が等しいことを可測(measurable)といいます。


ジョルダンの測度
敷き詰めるタイルが大きいとき、内測度は外測度より小さくなります。1m四方のタイルは、曲線を描く敷地にピッタリ敷き詰められず、隙間ができます。これを敷地境界にかかるように敷き詰めると、大きくはみ出します。

敷地へのフィット感を高めるために、タイルを50cm四方、10cm四方、5cm四方、1cm四方、…とどんどん小さくしてみましょう。とてつもなく変な形をした敷地でない限り、あるところで内測度の上限と外測度の下限が一致します。この可測な敷地の面積をジョルダン測度(Jordan measure)といいます。


ルベーグの測度
ジョルダンは、敷地に有限個のタイルを敷き詰めることを考えました。この考えを拡張して、敷地に可算無限個のタイルを敷き詰めることを考えたのがルベーグです。

敷き詰めるタイルの枚数を可算無限個へ拡張すると、ジョルダン不可測な敷地の面積も測れるようになります。ここでは、1m四方の正方形から、縦横ともに有理数の値をもつ可算無限個の点(有理点)をすべて除いた図形を例にします(志賀浩二『ルベーグ積分30講』p.41, 図13)。極小・無数の穴が空いた1m四方のメッシュのイメージです。

ジョルダンの方法にはタイルが有限個しかありませんので、可算無限個の穴すべてをカバーできません。ルベーグの方法にはタイルが可算無限個用意されていますので、穴すべてをカバーできます。極小のタイルでカバーした穴それぞれの面積を0とみると、それを可算無限個足し合わせた面積も0になります。すると、このとてつもなく変な形をした敷地の面積は1平方メートルと0の差、1平方メートルとなります。

外側から測った正方形の面積-可算無限個の穴の面積総計
=1-0=1

(志賀浩二『ルベーグ積分30講』p.99は、閉包と内点集合が一致しないときジョルダンの測度が機能せず、ルベーグ測度が有用になると指摘しています。)


*  *  *


ルベーグの考えをまとめましょう。 j(.), m_*(.), m^*(.)をそれぞれ、ジョルダン測度、ルベーグ内測度、ルベーグ外測度とします。このとき集合Aのルベーグ内測度m_*(A)は、ジョルダン可測な大枠Eと、EからAを除いた部分(E-Aの外測度)の差となります。すなわち

m_*(A)=j(E)-m^*(E-A)

集合Aの中心部からきわへ向かって外測度の上限をとり、Aの外側を塗りつぶすとAが浮かび上がるイメージです。ルベーグ可測であるとき、内測度と外測度は等しくなります。よって

m^*(A)=j(E)-m^*(E-A)


*  *  *


カラテオドリの可測
上式の右辺にあるm^*(E-A)を移項して、左右入れ替えると

j(E)=m^*(A)+m^*(E-A)

Aが可測であるときj(E)=m^*(E)であり、またAEの部分集合であることに注目するとm^*(A)=m^*(E\cap A)が成り立ちます。これらを代入すると

m^*(E)=m^*(E\cap A)+m^*(E-A)

ルベーグの外測度m^*(.)\mu(.)に置き換えると

\mu(E)=\mu(E\cap A)+\mu(E-A)

すべてのEについてこの式が成り立つとき、A可測であるといいます。このように表現するのは、もともとAの可測性を示す式を変形して得られた式であるためです。上式は次のようにも書けます。A^cの可測性については次回説明します。

\mu(E)=\mu(E\cap A)+\mu(E\cap A^c)

この式は、Aに含まれるものと含まれないものにEを二分して測った測度の和が、Eの測度に等しいことを示しています。距離空間でもデデキントの定理、ベールのカテゴリー定理、可分性など全体を二分する話が出てきました。数学では「これとこれ以外」という分けかたが認識の基礎になっているようです。この可測の条件は、ルベーグと同じ世代のギリシャ人数学者、カラテオドリ(Constantin Carathéodory)が提示しました。それで、カラテオドリの条件といいます。


*  *  *


カラテオドリ測度の性質
カラテオドリの外測度(exterior measure, outer measure)には次のような性質があります。

  1. 0\leq\mu(A)\leq\infty
  2. \mu(\varnothing)=0
  3. A\subset E \implies \mu(A)\leq\mu(E)
  4. A\subset\bigcup_{j=1}^{\infty}A_j \implies \mu(A)\leq\sum_{j=1}^{\infty}\mu(A_j) 

記号ばかりですので説明を加えます。まず1ですが、測度はマイナスの値をとりませんが、無限大まで大きな値はとりうるということです。

つづいて2ですが、これは空集合\varnothingを測った値を0とするということです。空集合とは、何も載っていないお皿🍽️のイメージです。お皿に何か載っている🍛のであれば、カロリーを測ったり、重さを測ったり、大きさを測ったりできますが、何も載っていなければ測りようがありません。そうしたものの値は0にするということです。条件1で測度の下限を0にしましたが、これは空集合の測度を0と定義することによります。

3は単調性(monotonicity)といわれる性質です。より大きなものにより大きな値を与えるという測度の性質です。たとえば、東京都より日本国のほうが大きいので、東京都の面積より日本国の面積のほうが広いと評価するということです。もし「東京都の面積より日本国の面積のほうが狭いです」と言われると、私たちは「えっ?」となってしまいます。「他も含めた敷地の面積はもとの敷地の面積より広くなる」という、私たちの常識的な感覚と合う測度の性質が単調性です。

4は劣加法性(subadditivity)といわれる特徴です。外測度を測るとき、敷き詰めるタイルが重なっていても構いません。また、境界にかかるようにタイルを敷き詰めます。それで、敷き詰めたタイルそれぞれの面積の合計は敷地面積以上になります。距離空間には三角不等式がありました。これは、ゴールに真っ直ぐ突き進むより、どこかに立ち寄ったほうが距離は長くなるという性質です。この特徴を、より一般的な測度の世界でも保つということです。

条件4を用いると、可測の条件を弱く表現できます。

\mu(E)\geq\mu(E\cap A)+\mu(E\cap A^c)

なぜかというと、逆向きの不等式(\leq)は条件4そのものだからです。


*  *  *


一般的理論に還元されてしまうと、数学は内容のない単なる美しい形式になってしまう。そしてそれはすぐに死にたえてしまう

(ルベーグの言葉を引用したメルツバッハ=ボイヤー『数学の歴史』からの引用を引用した志賀浩二『ルベーグ積分30講』数学30講シリーズ, 9, 朝倉書店, 1991, p.38)


2024年5月5日

距離空間の可分性(Metric Space)

※私は数学者ではありません。自分用のまとめとしてこれを書いています。楽しむ範囲でご覧いただければ幸いです。内容の正確性については専門家のサイトや動画、あるいは専門書で必ず確認をお願いします。


*  *  *


距離空間(X, d)において、可算・稠密な部分集合があることを可分(separable)といいます。たとえば、実数には可算・稠密な有理数という部分集合がありますので、可分です(ベールのカテゴリー定理)。言い換えると、下式のように、部分集合の閉包(部分集合とその導集合の和)が全体集合になっているとき、可分といいます。

\mathbb{R}=\overline{\mathbb{Q}}=\mathbb{Q}\cup\mathbb{Q}^d


p-ユークリッド空間
N次元の実数\mathbb{R}の距離空間(\mathbb{R}^N, d)の可分性について考えます。ここで距離の測りかたd_pを次のように定義します。

d_p=\left(\sum_{n=1}^N|x_n-y_n|^p\right)^{1/p}

ここで、pは1以上の有限な実数です。pの値が無限大であるときには、各要素どうしの距離のうち最長のものを距離とします。

d_{\infty}=\left(\sum_{n=1}^N|x_n-y_n|^{\infty}\right)^{1/{\infty}}=\max_{1\leq n\leq N}|x_n-y_n|

d_{\infty}\max関数になるのは、絶対値で測った最長の距離を無限大乗した値は、他の小さな値の無限大乗を圧倒(dominate)するためです。最長の距離以外のものは視界から消えるということです。

これらの距離空間はいずれも可分です。なぜかというと、実数は有理数 \mathbb{Q}と無理数(有理数の集積点、つまり有理数\mathbb{Q}の導集合の要素)の和集合だからです。任意の実数xについて

x\in\mathbb{Q}\cup\mathbb{Q}^d

右辺は閉包に等しいので

\mathbb{R}=\overline{\mathbb{Q}}

これは可分の定義そのものです。


l^p空間
数列(sequence of numbers)とは、数を並べたものです。似たものに点列がありますが、点列は空間に置かれた点の集まりです。1次元の点列が数列です。

次の条件を満たす実数からなる数列\{\boldsymbol{x}_j\}_{j=1}^{\infty}l^p空間といいます。

\sum_{j=1}^{\infty}|x_j|^p<\infty

この空間での距離の測りかた d を次のように定義します。

d_p(\{\boldsymbol{x}_j\}_{j=1}^{\infty}, \{\boldsymbol{y}_j\}_{j=1}^{\infty})=\left(\sum_{j=1}^{\infty}|x_j-y_j|^p\right)^{1/p}

この数列空間も、上と同様の議論から可分です。


l^{\infty}空間
l^p空間のpを無限大にしたものをl^{\infty}空間といいます。この空間での距離の測りかた d を次のように定義します。

d_{\infty}(\{\boldsymbol{x}_j\}_{j=1}^{\infty}, \{\boldsymbol{y}_j\}_{j=1}^{\infty})=\sup_{j\in\mathbb{N}}|x_j-y_j|

l^{\infty}空間内の集合Eは可算ではなく、稠密でもありません。したがって l^{\infty}空間は可分ではありません。この証明のラフ・スケッチは次のとおりです(現時点の私の理解の範囲内です)。


*  *  *


実数直線上の閉区間[0, 1]を例にとります。この区間内の数は複数の2進数展開で表すことができます。たとえば、0.5は

0.5=\frac{1}{2}+\sum_{j=2}^{\infty}\frac{0}{2^j}


0.5=\frac{0}{2}+\sum_{j=2}^{\infty}\frac{1}{2^j}

このことは、閉区間[0, 1]内の数を表す2進数展開の分子を数列に見立てたものの濃度は、閉区間[0, 1]の濃度以上であることを意味します。つまり

\aleph\leq|2進数展開の分子を数列に見立てたもの|

この不等式は、可分性の条件の1つである可算と矛盾します。

もう1つの条件は稠密ですが、これは集積点がとれるかどうかで判定します。閉区間[0, 1]から互いにごく近い2点x, yを取り出し、2進数展開します。xyの値が異なるということは、2進数展開のいずれかの項の値が異なるということです。たとえば、第 j 項の値だけが次のように異なるとしましょう。

xの第 j 項:\frac{1}{2^j}  yの第 j 項:\frac{0}{2^j}

ここで分子だけ取り出すと1と0になります。したがって、x, yの距離を l^{\infty}で測ると、絶対値ですから1になります。この1は孤立点となり、集積点になりえません。これは、x, yを表す2進数展開の数列のl^{\infty}距離が稠密でないことを意味します。

可分の条件である可算も稠密も満たさないことから、数列空間l^{\infty}は可分ではないことがわかりました。


*  *  *

証明の詳細はとても難しいです。また理解が進んだら戻ってきて、よりよい形になるよう加筆・修正したいと思います。


2024年5月4日

集合の直径、集合と集合の距離、集合と点の距離(Metric Space)

※私は数学者ではありません。自分用のまとめとしてこれを書いています。楽しむ範囲でご覧いただければ幸いです。内容の正確性については専門家のサイトや動画、あるいは専門書で必ず確認をお願いします。


*  *  *


2点間の距離を応用すれば、点と集合の距離や集合と集合の距離も測れそうです。また、集合の幅のようなもの(集合の直径)も測れそうです。今回は、これらの測りかたを紹介します。以下はすべて距離空間 (X, d)についての話であり、xXの要素、A, B, EXの非空な部分集合とします。


点と集合の距離
まず、点と集合(要素の集まり)の距離を考えましょう。直感的には、点と集合内の各要素の距離のうち、最も短いものが点と集合の距離になりそうです。日常会話で「コンビニまでの距離」と言うとき、最寄りのコンビニまでの距離ですよね。距離空間では、この直感どおりに点と集合の距離を定義します。点x^*と集合Eの距離は

d(x^*, E)=\inf\{d(x^*, x)|x\in E\}

\infは下限です。高校のとき、点と線の距離という単元がありました。あのとき、点から線に向かって垂線(直角に交わる線)を引いたのは、点から線という集合への最短距離を測るためでした。

x^*が集合Eの内点または境界点であるとき、点と集合の距離は0です。


集合と集合の距離
つづいて、集合と集合の距離を測りましょう。距離空間では、集合Aと集合Bの距離を次のように測ります。

d(A , B)=\inf\{d(a, b)|a\in A, b\in B\}

これも、最寄りの距離です。コンビニとドラッグストアの距離というとき、コンビニの隣にドラックストアが立地していれば、その距離を測りましょうということです。これも直感に合います。わざわざ目の前のコンビニと隣町のドラッグストアの距離を測らないですよね。

集合ABに共通部分があるとき(A\cap B\neq\varnothing)、2つの集合の距離は0とします。商業施設の中にコンビニとドラッグストアが併設されているとき、どちらも商業施設内にあるという意味では、距離が0だと言えます。


集合の直径
集合の直径についても考えることができます。Xの有界な部分集合E直径(diameter)を、その要素x_1, x_2で表すと

diam(E)=\sup\{d(x_1, x_2)|x_1, x_2\in E\}

\supは上限です。集合が楕円のような形をしているとき、長径(長い方の「直径」)を集合の直径とする、というイメージです。

Eが1点集合(要素が1つだけ)であるとき、直径は0です。

ここまでの知識を用いると、集合と集合の距離、そして集合の直径の関係を表すことができます。2つの集合ABについて

diam(A\cup B)\leq diam(A)+diam(B)+d(A, B)

上でも書きましたが、ABに共通部分があるときd(A, B)=0になります。ABに共通部分がないときにはd(A, B)>0になります。


距離の写像の連続性
ここまで、点は動かないと仮定していました。点が連続に動くとき、点 x と集合Eの距離を次のような連続写像とみなすことができます。

f:X\rightarrow \mathbb{R}^+

ここで用いる連続の概念はリプシッツ連続です。すなわち、写像 f は次の条件を満たします。

d(f(x_1), f(x_2))\leq K\cdot d(x_1, x_2)

この不等式が成り立つことを示しましょう。すべてのx\in Eについて、点と集合の距離の定義から、次の不等式が成り立ちます。

d(x_1, E)\leq d(x_1, x)

これは、点x_1と集合Eの距離は、2点x_1xの距離のうち最短のものであるという、点と集合の距離の定義からわかります。つづいて、右辺に三角不等式を適用すると

d(x_1, E)\leq d(x_1, x)\leq d(x_1, x_2)+d(x_2, x)

真ん中の式を除いて、最左と最右の式に注目します。

d(x_1, E)\leq d(x_1, x_2)+d(x_2, x)

この式は任意のxについて成り立ちます。\inf d(x_2, x)=d(x_2, E)であることに注意して、d(x_2, x)d(x_2, E)を代入して左辺に移項すると

d(x_1, E)-d(x_2, E)\leq d(x_1, x_2)

x_1x_2を入れ替えてもこの関係は成り立つので

d(x_2, E)-d(x_1, E)\leq d(x_2, x_1)

距離の定義からd(x_1, x_2)=d(x_2, x_1)が成り立つことに注意して、上の2式をまとめると

|d(x_1, E)-d(x_2, E)|\leq d(x_1, x_2)

左辺の絶対値は距離の尺度とみなせます。すなわち

d(f(x_1), f(x_2))=|d(x_1, E)-d(x_2, E)|

すると

d(f(x_1), f(x_2))=|d(x_1, E)-d(x_2, E)|\leq d(x_1, x_2)

ここで、すべての\varepsilon>0についてd(x_1, x_2)<\varepsilonとすると

d(f(x_1), f(x_2))\leq d(x_1, x_2)<\varepsilon

d(x_1, x_2)\varepsilonに上から抑えられ、d(f(x_1), f(x_2))d(x_1, x_2)に上から抑えられることがわかりました。これは、リプシッツ連続の条件そのものです。


2024年5月1日

ユークリッド空間(Metric Space)

※私は数学者ではありません。自分用のまとめとしてこれを書いています。楽しむ範囲でご覧いただければ幸いです。内容の正確性については専門家のサイトや動画、あるいは専門書で必ず確認をお願いします。


*  *  *


今回は、ユークリッド空間が距離空間であることを確認します。


コーシー=シュワルツの不等式
準備として、まずコーシー=シュワルツ(Cauchy-Schwarz)の不等式を紹介します。この不等式にはさまざまな相貌がありますが、ここで使うのに十分な次式を用います。

\left(\boldsymbol{ab}\right)^2\leq\boldsymbol{a}^2\boldsymbol{b}^2

ここで、\boldsymbol{a}\boldsymbol{b} はともにベクトルです。この不等式が成り立つことを大まかにみましょう。以下、見やすくするために ab は太字にしません。少しトリックめいていますが、志賀浩二『固有値問題30講』数学30講シリーズ10, 朝倉書店, pp.61-62 にしたがい、実数 t に関する式 (at+b)^2 を作り、展開してみます。

(at+b)^2=a^2t^2+2abt+b^2

左辺は実数を2乗していますので非負です。また、a\neq 0 であるとき、下に凸な2次関数になります。これらのことに注意して判別式を書くと

D=(2ab)^2-4a^2b^2\leq 0

(ab)^2\leq a^2b^2

不等式が得られました。a=0であるときも、この式は等式として成り立ちます。


ユークリッド空間
幾何的な分析に有用な距離空間を、古代ギリシャの幾何学者ユークリッドにちなんでユークリッド空間(Euclidean space)といいます。この空間は、距離を測るために生成されたn 次元の実数空間\mathbb{R}^nです。

この空間内の距離の測りかたとしてひろく知られているのが、いわゆる2乗してルートをとる三平方の定理です。たとえば、座標平面上の原点とP(1, 2)の距離は

\sqrt{(1-0)^2+(2-0)^2}=\sqrt{5}

一般に、\mathbb{R}^nに置かれた2点\boldsymbol{x}, \boldsymbol{x'}の距離は

d=\sqrt{(x_1-x'_1)^2+(x_2-x'_2)^2+…+(x_n-x'_n)^2}


距離の定義
この測りかたが距離の定義を満たしていることを確認しましょう。以前の記事に書いた距離の定義を再掲します。

集合Xから取り出した要素x_1, x_2, x_3の距離 d が次の条件を満たすとき、これを距離空間という。

  1.  すべての x_1, x_2 について、0\leq d(x_1, x_2)<\infty
  2.  x_1=x_2d(x_1, x_2)=0 は同値である
  3.  x_1\neq x_2 であるとき d(x_1, x_2)=d(x_2, x_1)
  4.  d(x_1, x_3)\leq d(x_1, x_2)+d(x_2, x_3)

これらの条件を満たしているか、1つずつ確かめましょう。

まず1つめですが、d に入る数はすべて実数であり、そのすべてを2乗して足していますので、負値は取り得ません。よってd は非負です。d の値が無限に発散しないためには有界性を示さなければなりませんが、私の能力を超えます。ただ、無限の距離を持つものは、そもそも考慮の対象外とするのが自然です。

2つめは、同じ座標に置かれた2点の距離は0であり、距離が0であれば2点は同じ座標に置かれているということです。座標平面に置かれた2点 P(1, 2)Q(1, 2)を例にしましょう。これら2点間の距離は、次のように0であることがわかります。

PQ=\sqrt{(1-1)^2+(2-2)^2}=0

この式の計算結果が0であるのは、ルートの中の各項の引き算の値がすべて0であるときだけです。そして、各項の引き算の値が0になるのは、各項の2つの数がまったく同じ値をとるときだけです。これは2点の座標がまったく同じであることを意味します。

3つめは、こちらからあちらへの距離と、あちらからこちらへの距離は同じであるということです。これはルートの中の各項が2乗されていることから明らかです。上でみた2点O(0, 0)P(1,2)を例に式で確かめてみましょう。わざわざ式を書くまでもありませんが…

OP=\sqrt{(1-0)^2+(2-0)^2}=\sqrt{5}
PO=\sqrt{(0-1)^2+(0-2)^2}=\sqrt{5}

4つめはいわゆる三角不等式と呼ばれているものです。真っ直ぐゴールへ突き進む距離より、途中でどこかへ立ち寄る距離の方が長いという、これも単純明快なものです。上に掲げた不等式の左辺と右辺にユークリッド距離を代入してみましょう。

 左辺=\sqrt{(x_1-x_3)^2}  右辺=\sqrt{(x_1-x_2)^2}+\sqrt{(x_2-x_3)^2}

それぞれ2乗すると

 左辺=(x_1-x_3)^2  右辺=\left(\sqrt{(x_1-x_2)^2}+\sqrt{(x_2-x_3)^2}\right)^2

左辺を若干書き換えて展開すると

左辺=((x_1-x_2)+(x_2-x_3))^2=(x_1-x_2)^2+(x_2-x_3)^2+2(x_1-x_2)(x_2-x_3)

右辺を展開すると

 右辺=(x_1-x_2)^2+(x_2-x_3)^2+2\sqrt{(x_1-x_2)^2}\sqrt{(x_2-x_3)^2}

左辺と右辺の違いは第3項だけです。よく見ると、左辺と右辺それぞれの第3項について、係数2を除いて2乗したものの比較はコーシー=シュワルツの不等式そのものです。すなわち

((x_1-x_2)(x_2-x_3))^2\leq(x_1-x_2)^2(x_2-x_3)^2

定義どおりに左辺\leq 右辺が示されました。2乗してルートをとる三平方の定理は距離空間の定義をすべて満たすことがわかりました。この測りかたをする距離空間をユークリッド空間といいます。


2024年4月30日

ベールのカテゴリー定理(Metric Space)

※私は数学者ではありません。自分用のまとめとしてこれを書いています。楽しむ範囲でご覧いただければ幸いです。内容の正確性については専門家のサイトや動画、あるいは専門書で必ず確認をお願いします。


*  *  *


今回はベールのカテゴリー定理についてみます。なんだかどんどん高度になり、クライマーズ・ハイの感じは否めませんが、文系の "だいたい" の話としてみてください。全編とおして完備な距離空間内の話です。


集合のカテゴリー
いくつかの用語を導入することから始めます。内点が取れない閉包を疎集合(nowhere dense set)といいます。そして、この和集合を痩集合(meagre set)、または第1類の集合といいます。これに対して、疎集合の補集合を稠密な開集合(dense open set)といい、痩集合の補集合(稠密な開集合の積集合)を非痩集合(nonmeagre set)、または第2類の集合といいます。痩せているかどうかが集合の名前になるのは面白いです。(meagerという綴りはアメリカ英語だと思います。)

ベール(Baire)という数学者は、完備な距離空間における集合を第1類と第2類に二分できると考えました。これがカテゴリー(category)という考え方です。


ベールのカテゴリー定理
ベールは、カテゴリーに関する次の定理を導きました。

完備な距離空間(X, d)内で、非痩集合はXについて第2類である。

ほぼ定義にしか見えない定理です。ただ、逆は必ずしも真ならず、だそうです。あまりに抽象的で狐につままれた感じがします。ですが、要するにあれかこれか白か黒かという二分法で考えましょう、ということです。物事をカテゴリーで考えるとき、その有用性がわかります。どういうことかというと

痩集合=痩集合\cup 非痩集合

であれば、右辺の痩集合は自動的に非空集合になります。そして

非痩集合=痩集合\cup 非痩集合

であれば、右辺の非痩集合は自動的に非空集合になります。このように特徴を二分して、それぞれの特徴を持つカテゴリーに分類されるものが存在するか調べるときに使う感じになりそうです。

もうひとつ、実数直線を例に考えます。有理数は、実数直線上に疎に散らばっています。1つ1つの有理数は他のどの有理数ともつながっていません。それぞれが内点を持たない閉包です。よって、有理数は実数について第1類です。これに対して、開区間(0, 1)は実数について第2類です。なぜかというと、この区間は疎ではなく完備だからです。(測度0と正測度のものに集合を二分する、という感じでしょうか…)

節分のときの豆まきを思い浮かべましょう。和室の床(完備な距離空間)に撒かれた豆(点)は疎に散らばっています。足の踏み場もないほどぎっしり埋まることはありません。このような、床が見える状態は第1類です。

これに対して、和室に高級な絨毯を敷くと、その部分は床が見えなくなります。これは第2類です。

*  *  *

今回はとても難しい話でした。また少し理解が進みましたら戻ってきてよりよいものにしたいと思います。


2024年4月29日

リプシッツ連続とバナッハの不動点定理(Metric Space)

※私は数学者ではありません。自分用のまとめとしてこれを書いています。楽しむ範囲でご覧いただければ幸いです。内容の正確性については専門家のサイトや動画、あるいは専門書で必ず確認をお願いします。


*  *  *


今回はリプシッツ連続とバナッハ=ピカールの不動点定理に触れます。これらのトピックスはとても高度ですので、詳細は専門家の動画やサイト、著作等をご覧いただければと思います。ここでは文系の "だいたい" で不動点の物語をお話しします。


リプシッツ連続
距離空間(X, d)のすべての要素 x_1, x_2 について次が成り立つ写像 f:X\rightarrow Xリプシッツ連続(Lipschitz continuity)といいます。
 
d(f(x_1), f(x_2))\leq K\cdot d(x_1, x_2)

ここでKは非負の値をとる係数です。この係数は様々な値を取り得ますが、そのうち最小の値をリプシッツ定数といいます。この定数をK_*と表記しましょう。K_*<1のとき、f(x_1)f(x_2)の距離が徐々に縮まります。それで、縮小写像(contraction mapping)といいます。


バナッハ=ピカールの不動点定理
完備な距離空間から1点を取り出し、得られた像が入力した点と同じである、すなわち

f(x^*)=x^*

であるような点 x^*不動点(fixed point)といいます。バナッハ=ピカールの不動点定理(Banach-Picard fixed point theorem)は、不動点が得られる条件と不動点の一意性を次のように示したものです。

完備な距離空間(X, d)の写像 f:X\rightarrow X縮小写像であるとき、この写像の不動点 x^*ただひとつ存在する

まず、不動点が得られる条件として、写像が縮小写像であることを指定しています。これは上で説明しましたので繰り返しませんが、縮小写像であることは、距離が徐々に縮まる基礎的な条件です。

不動点が得られるもうひとつの条件として、完備な距離空間を指定しています。完備とは、距離の測定値が必ず見つかるということです。距離を測ろうにも、その値が距離空間の中になければどうしようもありません。空間内には、穴が1つたりともあってはいけません。あらゆる測定値を返せなければなりません。


J.M.ケインズは、その主著『雇用、利子及び貨幣の一般理論』の第23章第5節脚注3に、J. ベンサム "Defence of Usury"の一節を引用しています。Curtuisの沼として知られている一節です。

技芸の轍、すなわち発起人の足跡が刻まれた偉大な道のりは、クルティウスを飲み込んだような裂け目が無数にある広大な、そしておそらくは無辺の地平として考えられるかもしれない。裂け目が閉じるためには、その裂け目に落ちる勇者の犠牲がそれぞれの〔裂け目〕に要求されるが、いったんそれが閉じれば二度と開くことはない。それで、後からやってくる人たちにとって、その道のりははるかに安全になる。(訳文は筆者)


無数の開拓者の失敗によって陥穽が塞がれてはじめて、事業は安全になる、という文脈です。同様に、有理数にある穴すべてが無数の無理数によって完全に塞がれてはじめて、点列は安心して不動点に向かえます。


そしてもうひとつ、とてつもなく重要なのが不動点の一意性です。これをたとえると、集合という宇宙のどこから出発しても、ただひとつの点に行き着くということです。宇宙のすべてを引き寄せる、この上なく強力なブラックホールが宇宙にひとつだけある。フランスの詩人ラ・フォンテーヌは「すべての道はローマに通ず」という名言を遺しましたが、まさにそんな感じです。

宇宙のどこから出発しても答えはひとつというのはいかにも西洋的な、デカルト的な発想ではありますが、不動点定理が強力無比なツールであることは誰も否定できないでしょう。


*  *  *


証明のスケッチ
バナッハ=ピカールの不動点定理の証明をスケッチします。詳細は専門書をご覧ください。まず、縮小写像を逐次的に巻き戻してみます。リプシッツ連続の不等式のx_1x_3に、x_2x_4に置き換えると

d(f(x_3), f(x_4))\leq K_*\cdot d(x_3, x_4)

ここで左辺のf(x_3)に注目します。x_3=f(x_2)x_2=f(x_1)を逐次入れ子(マトリョーシカ:🪆)状に代入すると、f の三重の合成関数になります。

f(x_3)=f(f(x_2))=f(f(f(x_1)))

これをf\circ f\circ f\equiv f^3と表記すると

f(x_3)=f^2(x_2)=f^3(x_1)

同様にf(x_4)=f^4(x_1)となります。これらを左辺に代入すると

d(f^3(x_1), f^4(x_1))\leq K_*\cdot d(x_3, x_4)

つづいて右辺に注目します。x_3=f(x_2)x_4=f(x_3)を代入すると

d(f^3(x_1), f^4(x_1))\leq K_*\cdot d(f(x_2), f(x_3))

d(f(x_2), f(x_3))\leq K_*\cdot d(x_2, x_3)だから

d(f^3(x_1), f^4(x_1))\leq K_*\cdot d(f(x_2), f(x_3))\leq K_*\cdot K_*\cdot d(x_2, x_3)

この作業を再度繰り返し、最左辺と最右辺の不等式だけ残して書くと

d(f^3(x_1), f^4(x_1))\leq K_*\cdot K_*\cdot K_*\cdot d(x_1, x_2)

x_2=f(x_1)を代入すると

d(f^3(x_1), f^4(x_1))\leq K_*^3 d(x_1, f(x_1))

これで、すべての写像の入力が点列の1つめの点x_1になりました。ここで3を j に一般化すると

d(f^j(x_1), f^{j+1}(x_1))\leq K_*^j d(x_1, f(x_1))

現状、2点はj 番目と j+1 番目でとなりあっていますが、2つめの点を1つ先に進め、j+2番目の点に変えます。すると

d(f^j(x_1), f^{j+2}(x_1))\leq K_*^j d(x_1, f(x_1))+K_*^{j+1}d(x_1, f(x_1))

2つめの点をもっと先の k+1 番目まで進めると

d(f^j(x_1), f^{k+1}(x_1))\leq K_*^j d(x_1, f(x_1))+K_*^{j+1}d(x_1, f(x_1))+…+K_*^{k-1}d(x_1, f(x_1))+K_*^{k}d(x_1, f(x_1))

d(f^j(x_1), f^{k+1}(x_1))\leq K_*^j\sum_{i=1}^{k-j}K^{i-1}d(x_1, f(x_1))

k が無限大に向かうと

d(f^j(x_1), f^{\infty}(x_1))\leq K_*^j\sum_{i=1}^{\infty}K^{i-1}d(x_1, f(x_1))

d(f^j(x_1), f^{\infty}(x_1))\leq K_*^j\frac{d(x_1, f(x_1))}{1-K}

j が無限大に向かうと、0\leq K_*<1よりK_*^jは0に向かうので、右辺は0に収束します(コーシー列)。この結果を式にすると

d(f^{\infty}(x_1), f^{\infty}(x_1))\leq0

x_1から始まる点列の行き着く先はf^{\infty}(x_1)で、ここから全く動かなくなることがわかりました。不動点をx^*とおくと

f^{\infty}(x_1)=f(x^*)=x^*

最後に一意性を示します。不動点が2つあると仮定し、これを否定する背理法です。x^*の他にx'というもうひとつの不動点があるとします。これら2点の距離とそれぞれの不動点を導く写像の距離は等しいので

d(x^*, x')=d(f(x^*), f(x'))

リプシッツ連続の不等式を右につけると

d(x^*, x')=d(f(x^*), f(x'))\leq K d(x^*, x')

真ん中を除き、最左辺と最右辺の不等式にして変形すると

d(x^*, x')\leq K d(x^*, x')

(1-K)d(x^*, x')\leq 0

0<1-K<1より、この不等式が成り立つのはd(x^*, x')=0のときだけであることがわかります。よって

x^*=x'

不動点の一意性が示されました。\Box


内点、開集合、閉集合、内点集合、集積点、導集合、閉包(Metric Space)

 ※私は数学者ではありません。自分用のまとめとしてこれを書いています。楽しむ範囲でご覧いただければ幸いです。内容の正確性については専門家のサイトや動画、あるいは専門書で必ず確認をお願いします。


*  *  *


前回の記事の終わりに、収束を調べるときには定義域から孤立点を除くことをみました。今回は、孤立点や導集合など、分析に用いるツールをいくつか紹介します。ここでの説明は、すべて距離空間(X, d)に関するものであり、xXの要素、EXの部分集合、\varepsilonは任意の小さな正の数とします。


内点、外点、境界点、触点
x とそのすぐそばの点がともにEの要素であるとき、xE内点(interior point)といいます。開球を用いて内点を表記すると

B_X(x, \varepsilon)\subset E

Eの補集合E^cの内点を外点(exterior point)といいます。開球を用いて外点を表記すると

B_X(x, \varepsilon)\subset E^c

内点でも外点でもない点を境界点(frontier point)といいます。数直線上の区間のきわ(よく白丸や黒丸で表されるはしっこ)に置かれた点、円の縁に置かれた点、球の表面に置かれた点は境界点です。xEの内点、外点、境界点のいずれかになります。

内点と境界点を合わせたものを触点(adherent point)といいます。


開集合と閉集合
Eの部分集合E_jの内点すべてからなる集合を開集合(open set)といい、開集合の補集合を閉集合(closed set)といいます。縁が開いた集合が開集合、縁が閉じた集合が閉集合です。数直線を例にとると開区間は開集合、閉区間は閉集合です。

空集合\varnothingと全体集合Xは開集合かつ閉集合とします。これらは例外的なものとして覚えておきましょう。回りくどく「Eの部分集合E_j」としたのは、次の内点集合との関連からです。


内点集合
Eの最大の開集合を内点集合とか内部(interior)開核(open kernel)といいます。ここでも数直線を例にとります。E=[1, 3]であるとき、E_1=(1, 2)E_2=(1.5, 2.5)E_3=(2, 3)はいずれもE内の開集合ですが、最大の開集合ではありません。最大の開集合はこれらの和集合、(1, 3)です。これを内点集合といいます。

外点をすべて集めた集合を外点集合とか外部(exterior)といい、境界点をすべて集めた集合を境界点集合(frontier)といいます。お互いの積集合はすべて空集合になり、これら3つの和集合は全体集合になります。内点集合を E^i、境界点集合をE^f、外点集合をE^eとおいて表記すると

E^i\cap E^f=\varnothing E^i\cap E^e=\varnothing E^f\cap E^e=\varnothing
E^i\cup E^f\cup E^e=X

世界は、風船の中と表面と外からできている、という感じです。


有界
Eが閉球に収まるとき、E有界(bounded)であるといいます。再び数直線を例にします。開区間E=(-1, 1)は閉球B_X(0, 2)、すなわち閉区間[-2, 2]、に収まります。よって集合Eは有界です。


集積点と孤立点
x^*に向かう収束列 \{\boldsymbol{x}_j\}E/x^*の部分集合であるとき x^*E集積点(accumulation point)といいます。

よくわかならい、というのが正直なところだと思います。「なぜx^*を除いた部分集合を考えるのか」と思います。ただ、集積点は幅広い集合に適用できるようによく考えられた概念であることに注意したいです。

見通しをよくするために数直線を例にします。開区間(0, 1)と2の和集合をEとおきます。Eの要素である数直線上の点2のように、集合内の他の要素から孤立している要素を孤立点(isolated point)といいます。孤立点に向かう点列をEの要素で生成しようがありませんので、孤立点は集積点になり得ません。前にも書きましたが、ゴールが絶海の孤島であるとき、そこへ徒歩で向かえますか? ということです。集積点は、孤立点を集合から除外するのに使えます。

また、集積点は集合に属している必要はありません。引き続き開区間と点の和集合Eを用います。0はEの要素ではありませんが、Eの集積点です。なぜかというと、Eの要素で0へ向かう点列を生成できるからです。\{0.1^j\}Eの部分集合であり、0へ向かう点列の例です。

幅広い集合のようすをつぶさに調べるツールとして集積点は有益です。


導集合と閉包
Eの集積点すべてからなる集合をE導集合(derived set)といい、 E^dと表記します。そして、Eを部分集合とする最小の閉集合をE閉包(closure)といい、\overline{E}と表記します。閉包はまた、触点すべてからなる集合でもあります。集合、導集合、閉包には次のような関係があります。

\overline{E}=E\cup E^d

再び数直線上の集合E=(0, 1)\cup 2を考えます。Eの導集合は[0, 1]です。これは、孤立点である2は集積点ではなく、0と1は集合Eに属していませんがEの集積点であるためです。Eに属していないEの導集合の要素はEの境界点ですので、右辺は[0, 1]\cup 2となります。0から1までが閉区間に変わります。左辺の閉包は[0, 1]\cup 2ですので、上の等式は成り立つことが確かめられます。

Eが閉集合であるときには、次の関係が成り立ちます。

E^d\subset E

Eを閉集合[0, 1]\cup 2としましょう。導集合は孤立点を除き、境界点を含みますので、E^d=[0,1]となります。よって、E^dEより要素2の分だけ小さい集合になります。

また、閉包は内点集合と境界点集合の和集合です。つまり

\bar{E}=E^i\cup E^f


*  *  *


上限と下限、最大元と最小元
・開集合の場合
数直線の開区間(0, 1)を例にします。この開区間には最大元も最小元もありません。しかし、1という上限と0という下限はあります。

・閉集合の場合
数直線の閉区間[0, 1]を例にします。この閉区間には1という最大元と0という最小元があります。また、1という上限と0という下限もあります。

これをどう理解するかですが、集合の要素を内点、外点、境界点の3種に分けるとすっきりしそうです。孤立点がない集合について

  • 上界、下界:外点集合と境界点集合
  • 上限、下限:境界点集合
  • 開集合:内点集合
  • 閉集合:内点集合と境界点集合


三分法で眺めると整理しやすそうです。この点、切断により集合は必ず半開区間と開区間に二分されるという連続の公理(デデキントの定理)はあまり強調しすぎないほうがよいのかもしれません…


2024年4月28日

ε-n論法とε-δ論法(Metric Space)

※私は数学者ではありません。自分用のまとめとしてこれを書いています。楽しむ範囲でご覧いただければ幸いです。内容の正確性については専門家のサイトや動画、あるいは専門書で必ず確認をお願いします。


*  *  *


前回の記事の終わりに収束という言葉を用いました。今回は収束を調べる重要なツールであるε-n論法とε-δ論法を紹介します。


ε-n論法
この論法は、点列の収束を調べるときに使います。ここでは前回紹介した収束列を例に概観します。まずは定義を振り返りましょう。距離空間 (X, d)内の点列がXの元 x^*に向かう収束列であるとは

 \lim_{j\rightarrow\infty}d( x_j, x^*)=0

これと同値な言明は

すべての \varepsilon についてある順番 \bar{j} が存在し、その順番以降のすべての点 x_jについて d(x_j, x^*)<\varepsilonとなる。

さらに、開球を用いた同値な言明は

すべての \varepsilon についてある順番 \bar{j} が存在し、その順番以降のすべての点 x_jについて x_j\in B_X(x^*, \varepsilon)となる。

このように、収束の定義に \varepsilonn(ここでは空間の次元に n を用いているので代わりに j で表記しています)が登場することから、イタリックで書いたように点列の収束を調べる方法をε-n論法といいます。

なんだか難しそうですが、点列が小さな球に収まるのであれば、もうそれはどこへも行かずそこに止まるということです。収束とは、もうどこへも行かないということです。


ε-δ論法
この論法は、写像の収束を調べるときに使います。距離空間(X, d_X)から孤立点を除いた部分集合 E から (Y, d_Y)への写像 fx^*で連続であるとは

 \lim_{x\rightarrow x^*}f(x)=f(x^*)

これと同値な言明は

すべての \varepsilon について、d_X(x, x^*)<\delta の像が d_Y(f(x), f(x^*))<\varepsilon を満たすような \delta が存在する。

さらに、開球を用いた同値な言明は

すべての \varepsilon について、x\in B_X(x^*, \delta) の像が f(x)\in B_Y(f(x^*), \varepsilon) を満たすような \delta が存在する

さらにコンパクトに表現すると

すべての \varepsilon について、f(E\cap B_X(x^*, \delta))\subset B_Y(f(x^*), \varepsilon) となる \delta が存在する。

プログラミングのコードを書き慣れてくると、できるだけコンパクトに表現したくなりますよね。なんだかそんな感じです。収束の定義に \varepsilon\delta が登場することから、イタリックで書いたように写像の収束を調べる方法をε-δ論法といいます。

これもとてつもなく難しそうですが、定義域の収束先であるx^*を中心とする小さな球の中から点を取り出して得られる像は、像の収束先である f(x^*) を中心とする小さな球に収まるということです。出所も行先も収束先のすぐそばというのは、収束の定義そのものです。

ここで定義域から孤立点を除いたのは、x^*が孤立点であるとき、そこへ向かう点列を作りようがないためです。絶海の孤島がゴールであるとき、そこへ徒歩で向かえますか? 無理ですよね。それで孤立点をあらかじめ除きます。

集合論の記法は、論理の穴を見つけるのにとても便利だと思います。これまで収束を調べるとき、孤立点について考えたことがありませんでした。

この記事はこちらの動画を参照しました。
こちらのpdfファイルもわかりやすいです。


*  *  *


さらに理解を深めるには、内点、内点集合、集積点、孤立点、導集合、閉包などの用語を知らなければなりません。すべてつながっていることが見えてくると、学びが止まらなくなります。


距離空間の定義、点、点列、部分列、収束列、コーシー列、開球、閉球(Metric Space)

※私は数学者ではありません。自分用のまとめとしてこれを書いています。楽しむ範囲でご覧いただければ幸いです。内容の正確性については専門家のサイトや動画、あるいは専門書で必ず確認をお願いします。


*  *  *


前回の記事で距離空間(X, d)を導入しました。距離空間を定義すると次のようになります。

集合Xから取り出した要素x_1, x_2, x_3の距離 d が次の条件を満たすとき、これを距離空間という。

  1.  すべての x_1, x_2 について、0\leq d(x_1, x_2)<\infty
  2.  x_1=x_2d(x_1, x_2)=0 は同値である
  3.  x_1\neq x_2 であるとき d(x_1, x_2)=d(x_2, x_1)
  4. d(x_1, x_3)\leq d(x_1, x_2)+d(x_2, x_3)

条件1は、私たちの日常感覚に合う条件です。距離は負値を取らず、また無限大にもなりません。条件2は、点の長さを0と定義するということです。条件3は前回の例で

d-c=28.9(cm)   c-d=-28.9(cm)

と、単純な引き算では異なる値になってしまうことをみました。これは距離の定義を満たしません。定義を満たすには、d-cc-d の値が等しくなければなりません。このために絶対値という測りかたを導入しました。絶対値で測ると値は同じになり、距離の定義を満たします。

|d-c|=|c-d|=28.9(cm)

条件4は三角不等式といわれるものです。太っちょの三角定規📐の3辺の長さを例に考えましょう。斜辺は底辺と高さの和より短いです。

\sqrt{2}(斜辺)\leq 1(底辺)+1(高さ)

のっぽの三角定規の3辺の長さも、この条件を満たします。

2(斜辺)\leq 1(底辺)+\sqrt{3}(高さ)

距離一般がこの不等式を満たすというのが条件4です。


*  *  *


距離空間(X, d)を分析するときによくみる用語をいくつか紹介します。以下、xXの要素とします。


距離空間にある距離0の要素を点(point)といいます。距離0の定義は

x_1=x_2\iff d(x_1, x_2)=0

この定義にしたがって丁寧に書くと、x_1, x_2の座標をともに書くべきなのかもしれませんが、表記する座標が全く同じなので、x_1またはx_2の座標のいずれか(どちらを書いても同じですが)を表記します。

数直線上の点の位置は、1つの数で表します。たとえば、数直線上の1に置かれた点の位置はp=1と表記します。座標平面上の点の位置は、2つの数の順序組で表します。たとえば、原点から東北へ\sqrt{2}だけ離れたところに置かれた点の位置はP(1, 1)と表記します。3次元空間内の点の位置は、3つの数の順序組で表現します。たとえば、原点から東北かつ上方45^{\circ}\sqrt{3}だけ離れたところに置かれた点の位置は P(1, 1, 1)と表記します。

一般に、n 次元空間内の点の位置は n個の数の順序組(n-tuple)で表します。


点列
点を並べた整列集合を点列(sequence of points)といいます。これまで紹介した数学の用語で記述すると、自然数\mathbb{N}から整列集合である点への順序同型写像を点列といいます。数直線上の数列は数が並んだものですが、それをn 次元空間に拡張した点列は n 次元ベクトルが並んだものです。一般に、点列を次のように表記します。xが太字になっているのは、それぞれの\boldsymbol{x}がベクトルであることを強調するためです。

\{\boldsymbol{x}_j\}=\boldsymbol{x}_1, \boldsymbol{x}_2, \boldsymbol{x}_3, …

数字をふつうの太さで、ベクトルを太字で表記することが望ましいのですが、太字が多くなると読みづらくなる面もあります。そこで、このブログでは点の座標など、ベクトルであることが明らかなときには太字ではなく、ふつうの太さの文字で表記します。たとえば、次のように表記します。

\{\boldsymbol{x}_j\}=x_1, x_2, x_3, …


部分列
点列の要素の一部を取り出し、順序を保ちながら生成した点列を部分列(subsequence)といいます。たとえば、自然数\mathbb{N}から偶数だけ抜き出して\{2, 4, 6, 8, …\}と順序を保ちながら並べたものは部分列です。


収束列
点列の十分後ろにゆくと、点の位置がほとんど動かなくなることがあります。このような点列を収束列といいます。点列がx^*に向かう収束列であるとは

 \lim_{j\rightarrow\infty}d(x_j, x^*)=0

x^*に向かう収束列は、他の点には向かいません。これを収束の一意性といいます。


コーシー列
収束列の条件を緩めたものにコーシー列(Cauchy sequence)があります。収束列と同じように値がどんどん近づいてゆくイメージですが、収束列では点列があらかじめ定めた点に向かうのに対して、コーシー列では点列どうしの距離が近づいてゆく感じになります。距離空間(X, d)内の点列がコーシー列であるとは

 \lim_{j, k\rightarrow\infty}d(x_j, x_k)=0

ある点列が収束列であればコーシー列です。さらに、コーシー列であれば有界な点列です。よって次のような関係が成り立ちます。

収束列\subset コーシー列 \subset 有界列


開球と閉球
開区間を概念拡張したものを開球(open ball)といいます。数直線上の開区間 (-1, -1)を2次元平面に拡張すると、中心(0, 0)、半径1の縁が開いた円になります。さらに、3次元空間に拡張すると中心 (0, 0, 0)、半径1の表面が開いた球になります。距離空間では3次元をイメージした語を用いますので、こうしたものを開球といいます。球の中心は0でなくても構いません。一般に、Xの要素であるx_0を中心とする半径 r の開球は、次のように表記します。

B_X(x_0, r)\equiv\{x\in X | d(x_0, x)<r\}

「球」というのは表現上のたとえです。数直線上の距離を考えるとき、開球は球ではなく区間です。平面上の距離を考えるとき、開球は球ではなく円です。3次元空間内の距離を考えるとき、開球は文字どおり球になります。

また、開球と対をなす閉球(closed ball)もあります。これは縁が閉じた球です。すなわち、不等号を等号付き不等号に代えたものです。

B_X(x_0, r)\equiv\{x\in X | d(x_0, x)\leq r\}


*  *  *


これらの用語はいずれも分析に不可欠なツールです。折にふれ確認しましょう。


2024年4月27日

連続の公理(Metric Space)

※私は数学者ではありません。自分用のまとめとしてこれを書いています。楽しむ範囲でご覧いただければ幸いです。内容の正確性については専門家のサイトや動画、あるいは専門書で必ず確認をお願いします。


*  *  *


切片の復習
「集合のはなし」のシリーズで紹介した、切片について復習するところから始めます。集合X=\{1, 2, 3, 4, 5, 6, 7\}の5に関する始切片は、5より前の(小さい)要素を並べた集合ですので

IS_X(5)=\{1, 2, 3, 4\}

始切片を生成する作業は、集合Xを下組\{1, 2, 3, 4\}と上組\{5, 6, 7\}に分割する作業とみなすこともできます。


生じうる分割の種類
一般に、集合Xを下組Aと上組Bに分割したとき、次の条件を満たすものを分割と呼ぶことにしましょう。

  •  A\neq\varnothing かつ B\neq\varnothing
  •  X=A\cup B
  •  Aから取り出したすべての要素 aBから取り出したすべての要素 b について、a<b

下組Aと上組Bの特徴は、次のいずれかの組み合わせになります。

  1.  Aに最大元があり、Bに最小元がある
  2.  Aに最大元があり、Bに最小元がない
  3.  Aに最大元がなく、Bに最小元がある
  4.  Aに最大元がなく、Bに最小元がない


前節では、A=\{1, 2, 3, 4\}B=\{5, 6, 7\}を得ました。Aには最大元4があり、Bには最小元5があります。この組み合わせはケース1に該当します。整列集合などを分割した結果はケース1になります。

整列集合ではない集合、たとえば全順序集合である有理数、を分割するといずれの結果になるでしょうか。有理数全体の集合\mathbb{Q}を、有理数0.5までとそれ以降に分割すると

A_{\mathbb{Q}}=(-\infty, 0.5]  B_{\mathbb{Q}}=(0.5, +\infty)

0.5はA_{\mathbb{Q}}に属し、B_{\mathbb{Q}}には属しません。A_{\mathbb{Q}}の最大元は0.5、B_{\mathbb{Q}}の最小元は、0.5以上で最小の有理数を指差確認できませんので、ないと評価します。この組み合わせはケース2に該当します。無理数を含む実数全体の集合\mathbb{R}を有理数0.5までとそれ以降に分割しても、結果はケース2になります。

A_{\mathbb{R}}=(-\infty, 0.5]  B_{\mathbb{R}}=(0.5, +\infty)

分割結果から有理数と実数の区別はつきません。同じものにみえます。ただ、集合の濃度は|\mathbb{Q}|<|\mathbb{R}|ですので、両者は明らかに異なります。分割結果からも有理数と実数の違いを特徴づけられるでしょうか。

ここで、実数の存在を知りつつ、有理数の集合だけを問題にするというアクロバティックな状況を考えます。話の見通しをよくするために有理数全体の集合\mathbb{Q}を、無理数\sqrt{2}を境に分割することを例にします。

A_{\mathbb{Q}}=(-\infty, \sqrt{2})  B_{\mathbb{Q}}=(\sqrt{2}, +\infty)

ABいずれも開区間になりますので、ケース4に該当します。ケース4になるのは、境である\sqrt{2}有理数ではなく無理数であるためです。無理数を含む実数全体の集合\mathbb{R}\sqrt{2}までとそれ以降に分割すると、有理数とは異なる結果になります。

A_{\mathbb{R}}=(-\infty, \sqrt{2}]  B_{\mathbb{R}}=(\sqrt{2}, +\infty)

A_{\mathbb{R}}が半開区間になりますので、ケース2に該当します。結果が異なるのは、境である\sqrt{2}が有理数ではなく、実数であるためです。


連続の公理
これを有理数と実数の違いとしよう、というのが連続の公理です。つまり、上のケース2とケース3のいずれかだけが生じうる集合だけを連続とみなそう、ということです。言い換えると、実数を超える濃度の数の集合はないと仮定する、ということです。これは公理ですので、真偽を議論する性質のものではなく、こうしておくと後の話がしやすいという性質のものです。

この公理を認めれば、生じうる分割結果で数の種類を区分けできます。

自然数(整列集合):分割の結果、ケース1が生じる

有理数(全順序集合):分割の結果、ケース2, 3, 4が生じうる

実数(連続な全順序集合):分割の結果、ケース2または3が生じうる


実数の空間では、直角三角形の斜辺など、無理数が生じうる距離も測れます。実際に存在する長さを測れるようにしましょう、というのが連続の公理です。


デデキントの定理
連続な全順序集合である実数の空間では、上のケース2とケース3だけが生じうるというのがデデキント(Dedekind)の定理です。上に掲げたケース2とケース3の番号を振り直し、デデキントの定理として再掲します。実数を下組Aと上組Bに切断した結果は次のいずれかになります。

  1.  Aに最大元があり、Bに最小元がない
  2.  Aに最大元がなく、Bに最小元がある

*  *  *


集合の外にあるものを使って集合を分割する、というのはかなりきわどいレトリックです。ただ、定規📏にたとえると、分からなくもないかなとも思います。定規に刻まれたcm単位の目盛りを0と自然数、mm単位の目盛りを有理数とすると、実数は目盛りを書き込んでいる定規の材質にあたります。プラスチックの定規をmm単位の目盛りの間でパチンと割れば、下組と上組が生じます。生じた2片を自然数(cmの目盛り)でみれば2つの半開区間、有理数(mmの目盛り)でみれば2つの開区間、実数(定規の材質)でみれば半開区間と開区間になります。

クランチチョコを2つに割れば、粒々すべてはいずれかの元

ただ、実数が「ベタっと」並んでいるイメージが適切なのかはわかりません。実数の内側から実数を見ている私たちには判断しにくいです。実数の外側から実数を見ると、わかるのかもしれません…

こちらの動画の32分くらいから、面白いです。
https://www.youtube.com/watch?v=DM3kMk9c31Q