Antkillerfarm Hacking V8.0

math » 数学狂想曲(七)——双曲函数和悬链线, 函数连续性

2017-09-22 :: 5704 Words

概率分布(2)

KS检验(续)

由于Nobel Prizes没有数学奖,因此数学界的最高奖一般有三个:
1.Fields Medal。获奖难度最高,因为有40岁的年龄限制。在国内比较知名的丘成桐、陶哲轩都是该奖的获奖者。
不过他们还不是最屌的。Grigori Perelman(Poincaré conjecture(庞加莱猜想)的证明者)直接拒绝了Fields Medal。除此之外,他还拒绝了EMS Prize和Millennium Prize,其中后者奖金高达100万美元,而且还不知道下一个获奖者什么时候诞生(该奖不是年度奖,而是数学难题奖,数学难题的解决周期,你懂的)。
Perelman犹如一个特立独行的隐士,谁的账都不买,包括名利。他将他的伟大证明随手扔进arXiv这样一个非正规网站,但却被《Science》评为年度科学突破。数学界已经很多年没有这样的荣誉了。
补充一下,Perelman就读的中学是Kolmogorov创建的。
2.Abel Prize。和Nobel Prizes的规则相同,由于不限年龄,水平是最高的。缺点是这个奖是2001年才创建的,影响力略差。
3.Wolf Prize。在Abel Prize创建之前,被誉为数学界的Nobel Prizes。

https://mp.weixin.qq.com/s/IVLsVR831pXki6QZ0BntpQ

百年未解的谜题:庞加莱猜想


上图的红线是某随机变量假设分布的CDF,而蓝线是该随机变量样本的累积分布曲线,即ECDF(Empirical Distribution Function)。

显然若假设正确的话,两条曲线应该是基本重合的。反之,若两条曲线差异较大,则该假设检验不成立。这就是KS检验的基本原理。

KS检验的统计量定义如下:

\[D_n= \sup_x |F_n(x)-F(x)|\]

其中\(\sup\)表示最小上界,

\[F_n(x)={1 \over n}\sum_{i=1}^n I_{[-\infty,x]}(X_i)\] \[I_{[-\infty,x]}(X_i)=\begin{cases} 1, & X_i \le x \\ 0, & \text{otherwise} \\ \end{cases}\]

KS检验更深入的解释,涉及到布朗运动和维纳过程,这里不再赘述。

参考:

https://mp.weixin.qq.com/s/YMKHw3qgWvhEz4f8nPw7Cg

5种数据同分布的检测方法

Pearson distributions

Pearson distributions是1895年左右由英国统计学家卡尔·皮尔逊提出的一组频率分布。它打破了“正态分布是全能的”传统观念,在数理统计发展史上是一个重大突破。

偏态分布:“正态分布”相对,分布曲线左右不对称的数据次数分布,是连续随机变量概率分布的一种。可以通过峰度和偏度的计算,衡量偏态的程度。可分为正偏态和负偏态,前者曲线右侧偏长,左侧偏短;后者曲线左侧偏长,右侧偏短。

概率密度\(f(x)\)决定于微分方程:

\[\frac{\mathrm{d}f(x)}{\mathrm{d}x}=\frac{(a_0+a_1x)f(x)}{b_0+b_1x+b_2x^2}\]

https://variation.com/wp-content/distribution_analyzer_help/hs130.htm

Pearson Family of Distributions

百年一遇

Gumbel distribution是一种根据频率曲线来计算“多年一遇”海洋水文气象要素的常用方法。Gumbel分布以Emil Julius Gumbel(1891-1966)命名。

https://www.zhihu.com/question/21315165

为什么所谓五十年一遇、百年一遇的自然灾害几乎年年发生?

双曲函数和悬链线

悬链线 (Catenary) 是一种曲线,因其与两端固定的绳子在均匀引力作用下下垂相似而得名。适当选择坐标系后,悬链线的方程是一个双曲余弦函数。

悬链线背后的故事和推导,百度百科已经比较详细了,不再赘述。参见:

http://baike.baidu.com/view/45656.htm

然而对于实际工程中的悬索结构,由于悬索自身的重量较其所提拉的跨度结构要轻得多,在力学简单计算中可以忽略,结构受力模式成为在水平长度范围内的均布荷载。这种荷载模式与拱结构相同,因此可以推导出在该荷载模式下的悬垂线为一抛物线,线型与拱结构相同,但内力为拉力。

在工程中完全按照悬链线进行设计的结构,恐怕只有高压输电线了。由于不承担任何自重以外的附加荷载,输电线的数学曲线会与悬链线完全一致。

双曲函数的性质,参见:

https://zhuanlan.zhihu.com/p/20042215

可能是最好的讲解双曲函数的文章

参考:

https://mp.weixin.qq.com/s/VOPis0wgmi-U-uM3Vnapbw

这根链子什么来头?

数学杂谈

当年洛伦茨求解这3个变量的方程组用的是一台Royal McBee LGP-30计算机,放置在MIT第24号楼第五层。这台机器比书桌还大,重约260公斤,可是速度极其缓慢,连今天的笔记本电脑都比它快上一百万倍。

当年,计算机程序是由两位年轻女助手艾伦·费特(Ellen Fetter)和玛格丽特·哈密顿(Margaret Hamilton)负责编写的。她们都是来到洛伦茨实验室工作后才开始学习编写计算机程序。

这位Margaret Hamilton就是后来编写阿波罗登月程序的女主。

https://mp.weixin.qq.com/s/REiUxKrLCRWeRCusVlooYQ

蝴蝶效应和混沌故事(Edward Norton Lorenz)


如果你往高尔顿板里倒入很多小球,一个惊人的规律就出现了:在底部堆积的小球的上边缘总是会形成一个近似钟形的曲线。在最接近中心的插槽中,小球会堆得高高的,插槽中的球数从中间向两侧递减,直至为零。

https://mp.weixin.qq.com/s/BwMAiziWQuyKaru8xB9tHw

一文读懂因果推断的起源

函数连续性

函数连续性本质上是刻画函数在自变量变化的情况下,函数值变化的稳定程度。

连续函数(Continuous function)

\[\forall x \in I \; \forall \epsilon > 0 \; \exists \delta > 0 \; \forall y \in I ; \, |x - y|<\delta \, \Rightarrow \, |f(x) - f(y)| < \epsilon\]

连续函数有很多种等价定义,为了方便和之后的一致连续进行对比,这里选用量词(Quantifier)逻辑的定义。

这个定义实际上是个Nest定义。以\(\exists\)为界,整个Quantifier被分成3部分:定值、存在变量、变量。上边的例子实际上是说:在给定\(x, \epsilon\)的情况下,存在\(\delta\),对所有y,结论都成立。

因为x不变,所以这实际上是个定点连续的条件。因此,这种连续又叫做Pointwise continuity。

通俗的说法:f的函数曲线在区间内没有断点。

一致连续(Uniform continuity)

\[\forall \epsilon > 0 \; \exists \delta > 0 \; \forall x, y \in I ; \, |x - y|<\delta \, \Rightarrow \, |f(x)-f(y)|<\epsilon\]

Uniform continuity比Pointwise continuity要严格一些,因为x,y都是变量。

Uniform continuity的形象解释如下所示:

上图中蓝框和红框的顶部和底部用粗线表示,在方框的运动过程中,红线始终没有穿过方框的顶部或底部,所以它是Uniform continuity的,而蓝线不是。

\(f(x)=\frac{1}{x}\)不是Uniform continuity的最大原因在于\(x\to 0,f(x)\to \infty\),由于值域没有上界,因此,对于给定的\(\delta\),\(\epsilon\)也是没有上界的。

但如果定义域限定为闭区间,则值域必有界。这时,Uniform continuity和Pointwise continuity是等价的。

绝对连续(Absolute continuity)

\[\forall \varepsilon > 0 \; \exists \delta > 0 \; \forall (x_k, y_k) \in I ; \, \sum_k (y_k - x_k) < \delta \, \Rightarrow \, \sum_k | f(y_k) - f(x_k) | < \varepsilon\]

Absolute continuity不仅要求整个函数满足Uniform continuity,而且任意子区间也要满足该条件。因此,Absolute continuity比Uniform continuity更严格。

Lipschitz连续

\[\forall x_1,x_2 \in I ;\mid f(x_1) - f(x_2)\mid \le K \mid x_1 - x_2\mid , K>0\text{ is const}\]

Rudolf Otto Sigismund Lipschitz,1832~1903,德国数学家,先后就读于柯尼斯堡大学和柏林大学,导师Dirichlet。波恩大学教授。

Lipschitz连续的直观图示如上所示。该曲线上的所有点的切线斜率的绝对值\(\le K\)。

易知,Lipschitz continuity比Absolute continuity更严格。

上式中的K被称为该函数的Lipschitz常数,因此,也可说\(f(x)\)是K-Lipschitz连续的。

连续可微

这个的定义比较简单:函数的导数是连续的。直观来说就是:函数曲线光滑,没有尖。

由“闭区间的连续函数必有界”可知,闭区间的Continuously differentiable一定是Lipschitz continuity的。

综上:

\[\text{Continuously differentiable} \subseteq \text{Lipschitz continuous} \subseteq \text{Absolute continuity} \subseteq \text{uniformly continuous} = \text{continuous}\]

需要注意,这些结论只在闭区间成立。比如\(f(x)=x^2\)是连续可微的,但却不是一致连续的。因此又有Local Uniform continuity之类的说法。

\((1/\gamma)\)-smooth

如果\(f(x)\)是可微的,且\(\nabla f(x)\)是\((1/\gamma)\)-Lipschitz的,则如果

\[f(b)\le f(a)+\nabla f(a)^{\top}(b-a)+\frac{1}{2\gamma}\|b-a\|_2^2\]

那么,\(f(x)\)是\((1/\gamma)\)-smooth的。

\(\lambda\)-strongly convex

\[f(b)\ge f(a)+\nabla f(a)^{\top}(b-a)+\frac{\lambda}{2}\|b-a\|_2^2\]

Weierstrass Function

Karl Theodor Wilhelm Weierstrass,1815~1897,德国数学家,被誉为“现代分析之父”。
青年时代,Weierstrass被父亲送到波恩大学学习法律和商业,然而他对此根本不感兴趣,精力都花到数学上了,这直接导致他离开大学时,没有拿到学位。
此后经过努力,他获得了一份中学数学教师的职位。他30~40岁的时光,就是在两所不知名的中学度过的。
所幸,他的努力没有白费。1854年,他获得格尼斯堡大学荣誉博士学位。此后先后任教于柏林工业大学和柏林洪堡大学。
他的博士学生知名的有:集合论创始人Georg Cantor,世界历史上第一位数学女博士Sofia Kovalevskaya和Hermann Schwarz(没错就是提出Cauchy–Schwarz inequality的那位)。

事实上,本文中使用的\(\varepsilon - \delta\)定义,就是Weierstrass的成果。Weierstrass首次采用数学的方式定义极限,取代了之前Newton的物理或几何式的极限定义。

物理或几何式的极限定义有着直观的优势,但不够严格,Weierstrass Function就是最好的反例。

Fork me on GitHub