極限・関数の大小比較とランダウの記法(駆け足で読む統計学のための数学入門30講 4)

  • 第4講 極限



関数はf(x)x¥to aにてある値¥alphaに収束する、もしくは、¥pm ¥inftyに発散するとき、次のように書く

¥lim_{x¥to a}f(x)=¥alpha,¥pm ¥infty

  • ポアソン分布は2項分布の生起確率Pをゼロに限りなく近づけたものに相当している
    • 2項分布は、ある事象が起きる確率Pと起きない確率1-Pであるときに、総計N回の観測で、k回起きる確率を与える分布である
      • P_r(x=k)=_n¥mathrm{C}_kP^k(1-P)^{n-k}
      • この式では、N回試行してk回起きる確率が求められている。言い換えると試行回数を指定して、起きる回数も指定することでその確率が求められている
    • ポアソン分布は2項分布の極限
      • 今、Pが非常に小さい事象を考える。非常に小さいのでこれくらい(たとえば1万回に1回くらい)なことはわかっているが、実際に何回試行するかは未定だとする。そのような場合にも、極限をとることで、事象がk回起きる確率が計算できる。それは、生起確率が非常に小さいので、実際にN回試行するとしようとN'回試行すると仮定しようと、N¥to ¥infty回試行すると仮定した場合とみなせるような状況だから、である(多分。)
      • 実際に2項分布の極限をとってみる
        • 非常に小さい生起確率¥lambda=¥frac{m}{n}とすると、n回の試行においてk回起きる確率は
          • P_r(x=k)=_n¥mathrm{C}_kP^k(1-P)^{n-k}=_n¥mathrm{C}_k(¥frac{m}{n})^k(1-¥frac{m}{n})^{n-k}
          • 今、n¥to ¥inftyとすると¥lin_{n¥to ¥infty}P_r(x=k)=¥frac{¥lambda^k}{k!}e^{-¥lambda}と式変形できて、これは、k回起きる確率が¥lambda(1万回に1回くらい稀な事象、というときの¥frac{1}{10000}とkのみによって決まることがわかる
  • アルゴリズムA1とアルゴリズムA2とがあって、いずれも、入力データサイズが大きくなれば大きくなるほど計算量は増える。したがって、いずれのアルゴリズムの計算量も発散する。しかしながら、アルゴリズムの計算量は、その発散の速さの多寡で比較する。そのときに用いるのが、ランダウO表記である
    • 今、ある関数f(x)g(x)x¥to ¥inftyにおいてともに¥inftyに発散するとする。そうは言っても、その発散の速度には違いが存在しえて、(1)¥lim_{x¥to ¥infty}¥frac{f(x)}{g(x)}=0の場合と、(2)¥lim_{x¥to ¥infty}¥frac{f(x)}{g(x)}=C,Cは定数の場合と、(3)それよりも大(xに関する増大関数)の場合とである。(1)の場合、g(x)f(x)より高位の無限大(より速く発散する)ことを示し、(2)の場合、f(x)g(x)と同位の無限大(同じくらいの速度で発散する)ことが示されている。(3)の場合にはf(x)g(x)より高位の無限大(より速く発散する)ことが示されている。(1)のとき、g(x)=o(f(x))と書いて、g(x)f(x)のスモールオーダーになっていると言う。(2)の場合には、g(x)=O(f(x))と書いて、ラージオーダーになっていると言う。(2)のようなとき、g(x)の計算量はたかだかf(x)のそれであることが示される。アルゴリズムAの計算量はO(N¥log N)である、などと用いる