在自学数理统计的过程中,一开始会迷茫在几个概念中,概率,随机变量、总体参数,统计量,纠结于大数定理,中心极限定理等等到底在讨论什么,甚而至于无法理解数学家们使用那么多数学计算到底为了什么。
说实在的,看国内的教材,传统的叙述方式几乎千篇一律。先是引入概率和概率计算,然后是随机变量的概念,介绍随机变量的分布,后面就会给出大数定理和中心极限定理。然后,总体和抽样,假设检验和参数分析,回归分析等等。初学时,很难理解,明明有平均值的概念,为什么要引入数学期望这个概念。
如果缺乏西方数学思想的理论背景,感觉真的很难理解数理统计学的逻辑脉络。
比如说,随机变量X是就一个总体(从哲学意义上,相当与一个本体,类似于柏拉图所说的“理念”,康德所说的“范畴”等概念)的一个特征。关于随机变量的概率分布,是假设其是先验的,也就是说是客观存在的一个属性。譬如在等可能性的假设下,我们把掷硬币的正面为1,负面为0,则理论上我们可以假定掷硬币正反面的概率是客观存在的,我们定义这种可能性为随机变量X的一个函数P(X)。在定义一个随机变量X的函数E(X),称为其数学期望,(当然这一概念,从其起源来讲还有其他含义),这也是客观客观存在的。由于E(X)的定义形式类似于统计量平均数的定义,在统计学中,我们一定程度上可以用随机变量的数学期望E(X)来刻画代表的总体参数μ 。
样本⇒ 总体 ⇒ 随机变量;频率 ⇒ 概率,这些概念的转化都有一个抽象的过程。从哲学本体论的角度,就由一个个体到本体的过程。唉,真的无法用语言清楚描述这一过程。
还是就中心极限定理来说,中心极限定理就是描述随机变量独立性体现的等可能性的角度,抽象分析独立抽样情况下的抽样均值对应的随机变量的统计规律。如果不理解这一点,就很难理解中心极限定理的含义。
有了中心极限定理,我们就有了假设检验和置信空间计算的理论依据。
中心极限定理
在不知道随机变量序列Xᵢ 的实际分布的情况下,采用大样本抽样,中心极限定理给出了关于样本均值的陈述:
Xᵢ是独立分布,且具有相同的均值 μ 和方差 σ² ,则抽样均值 (X₁+X₂+. . .+Xₙ)/n ~ N (μ,σ²)
)。
数学联邦政治世界观提示您:看后求收藏(同人小说网http://tongren.me),接着再看更方便。