中心极限定理和概率统计

2020-03-04 01:05:47 来源：范文大全收藏下载本文

若{Xn}的分布函数序列{Fn(x)}与X的分布函数F(x)有，在任意连续点x，limFn(x)F(x)。 n

依概率收敛

n若0，有P(XnX)0。准确的表述是，0，0，

N,nN，有P(XnX)成立

（3）几乎必然收敛

如果有P(limXnX)1。准确的表述是，除掉一个0概率集A，对所有的\\A，n

有limXn()X()成立。这是概率空间上的点收敛。 n

定理1。（切贝雪夫大数律）{Xn}相互独立，且有相同的期望和方差，（不一定同分布）

1nPE(Xn)uD(Xn)，n,记YnXi，则Ynu。 ni1

2统计发生——事物某方面的定量记录事前是不确定的，发生后的数据由真值和误差两部分构成，X。X是数据，是真值，是误差。导致误差的原因有：

1．系统性误差：偏离真值的本质性错误，有内在原因所致；

2．随机性误差：偏离真值的偶然性错误，没有内在原因，是纯偶然因素所致。

总体就是一个特定的随机变量

通过抽样，获得样本，构造样本统计量，由此推断总体中某些未知的信息

从总体中抽样是自由的，且当总体数量足够大，有放回与无放回抽样区别不大，有理由认为，取得的抽样观察值是没有关系的。所以，样本在未抽取前它们是与总体X同分布的随机变量，且是相互独立的，称此为随机样本。

定义2。设x1,,xn是取自总体X的一组样本值， g(x1,,xn)是Borel 可测函数，则称随机变量g(X1,,Xn)是一个样本统计量。

如果总体X中分布函数有某些参数信息是未知的，我们用统计量g(X1,,Xn)去推断这些信息，称此问题为统计推断问题。

给样本值x(x1,,xN),y(y1,,yN)，定义：（1）样本均值

(xi/n)

i

（2）样本方差

ˆx)ˆvar((xi)2 n1i1

ˆ样本标准差

s.e.e)

x)i( y)

（3）样本协方差cˆov(x,y)(1x

n1i1

样本相关系数

xy

ˆ(x,y)cov

1/2

ˆ(x)varˆ(y)][var

1nk

（4）样本k阶矩 Akxi k1,2,

ni11n

（5）样本k阶中心矩 Bk(xi)k

ni1



k1,2,

X的左侧分位点F，P(XF)dF(x)。左分位点的概率含义是，随机变量

F

不超过该点的概率等于

设总体X分布已知，但其中有一个或多个参数未知，抽样X1,,Xn，希望通过样本来估计总体中的未知参数，称此为参数估计问题，它是统计推断理论中最重要的基础部分。

用样本矩作为总体矩的估计量，以及用样本矩的连续函数作为总体矩的连续函数的估计量，这种方法称为矩估计法，这是一种最自然的估计方法。

ˆ(x,,x))对任意成立。当样本是称ˆ是参数的一个无偏估计，如果E(1n

有限的时候，我们首先要考虑的是无偏性。

n1n22

ˆS(Xi)2才是方差的无偏估计。故我们在样本统计量中定义n1n1i1

S2为样本方差。

ˆ是参数的一个一致估计，如果依概率有limˆ(x1,,xn)对任意成立。

n

有效性

在所有关于参数的无偏估计类中0，或所有的一致估计类1中，如果存在

ˆ*是参数的一个无偏有效估计或一ˆ*)D(ˆ)对任意ˆ或任意ˆ成立，称D(01

ˆ具有最小方差性。致渐近有效估计。即

。无论总体X分布是什么，任意样本Xi和都是X的无偏估计，但比单独的样本估计Xi更有效。

DXi，所以n

设总体X关于分布F(x,)存在两类问题，一类是分布的形式未知，一类是分布的形式已知但参数未知，提出的问题是，需要对分布的形式作出推断，此称为非参数检验的问题；或需要对参数作出推断，此称为参数检验问题。

奈克—皮尔逊定理告诉我们，当样本容量n固定，若要减少犯第一类错误的概率则犯第二类错误的概率会增加，要使两类错误都减少当且仅当增加样本容量。

超过了我们设定的F，（如，体温超过37度。）此意味一个小概率事件发生了。于是，我们有理由拒绝命题H0是真的。

X~N(u1,12)，Y~N(u2,2)，且相互独立，取样有(x1xn1),(y1yn2)。

欲检验H0:u1u2，或更一般，H0:u1u2u（u已知）。如何检验？

2（1）若1

2、2已知

因为~N(u1,

1

1)，~N(u2,

22

)，且相互独立，所以~N(u1u2,

122



)，

~N(0,1)，

所以可找到检验统计量U

。

（2）若1222，但未知，欲检验H0:u1u20，

因为V



222

[(n1)S(n1)S]~(n1n22)， 11222

且与

U

~N(0,1)独立，

n11n212

~t(n1n22)，令S2， S12S2

n1n22n1n22可得

V2S2，所以可找到统计量

n1n22

T



~t(n1n22)。

注：如果u未知，问题就变困难了，可以证明此时统计量T就是一个非中心的t分布。

（3）又如何知道1222？

12(n1)(n1)2可做假设检验H0:21。因为12S12~2(n11)，22S2 ~2(n21)且独立。

122

S12

所以，可找到统计量F2~F(n11,n21)。

（4）若122，且未知。问题就变困难多了，我们找不到合适的统计量。如果样本容量

足够大，那么，可以用渐近检验的办法处理。注意，U

中，因为12，2未

知，但已知S12,S2是12，2的一致估计，故用它们代替，有：

n1,n2

limU

~N(0,1)。

从而当n1,n2充分大时可用渐近正态检验。

又当n1n2n较小时，可以证明，

~t(n)，注意，此与T



~t(n1n22)

自由度不同。此意味当期望、方差相同时，样本可以合并，认为X,Y属于同一总体。当期望相同，方差不同时，样本不能简单合并。

注：关于H0:u1u2u，或H0:u1u2u，统计量相同，并采用单侧的右分位点或单侧的左分位点检验。

ˆ是无偏线性估计类中的有效估计。 OLS

ˆ 的极大似然估计在基本模型假定下就是OLS

估计做出后，评价、判断模型中的假定是否合理是对事前设定的模型做一个整体的把握。我们可以把这些假定、设定归结为一些对未知参数的判断，如果这些判断基本正确或错误，那么从整体数据中就能够反映出来。假设检验是估计完成后对模型的设定做进一步的确认。它以证否的形式完成。拒绝原假设，意味着命题真时犯错误的可能性可控制在一定的概率范围内。

概率统计第五章大数定律及中心极限定理

中心极限定理

考研概率知识点总结：大数定律和中心极限定理

将本文的Word文档下载到电脑，方便收藏和打印

推荐度：

点击下载文档

中心极限定理和概率统计

相关推荐