中心极限定理和概率统计

2020-03-04 01:05:47 来源:范文大全收藏下载本文

若{Xn}的分布函数序列{Fn(x)}与X的分布函数F(x)有,在任意连续点x,limFn(x)F(x)。 n

依概率收敛

n若0,有P(XnX)0。准确的表述是,0,0,

N,nN,有P(XnX)成立

(3)几乎必然收敛

如果有P(limXnX)1。准确的表述是,除掉一个0概率集A,对所有的\\A,n

有limXn()X()成立。这是概率空间上的点收敛。 n

定理1。(切贝雪夫大数律){Xn}相互独立,且有相同的期望和方差,(不一定同分布)

1nPE(Xn)uD(Xn),n,记YnXi,则Ynu。 ni1

2统计发生——事物某方面的定量记录事前是不确定的,发生后的数据由真值和误差两部分构成,X。X是数据,是真值,是误差。导致误差的原因有:

1. 系统性误差:偏离真值的本质性错误,有内在原因所致;

2. 随机性误差:偏离真值的偶然性错误,没有内在原因,是纯偶然因素所致。

总体就是一个特定的随机变量

通过抽样,获得样本,构造样本统计量,由此推断总体中某些未知的信息

从总体中抽样是自由的,且当总体数量足够大,有放回与无放回抽样区别不大,有理由认为,取得的抽样观察值是没有关系的。所以,样本在未抽取前它们是与总体X同分布的随机变量,且是相互独立的,称此为随机样本。

定义2。设x1,,xn是取自总体X的一组样本值, g(x1,,xn)是Borel 可测函数,则称随机变量g(X1,,Xn)是一个样本统计量。

如果总体X中分布函数有某些参数信息是未知的,我们用统计量g(X1,,Xn)去推断这些信息,称此问题为统计推断问题。

给样本值x(x1,,xN),y(y1,,yN),定义: (1)样本均值

(xi/n)

i

1n

(2)样本方差

1n

ˆx)ˆvar((xi)2 n1i1

ˆ样本标准差

s.e.e)

x)i( y)

1n

(3)样本协方差cˆov(x,y)(1x

n1i1

样本相关系数

xy

ˆ(x,y)cov

1/2

ˆ(x)varˆ(y)][var

1nk

(4)样本k阶矩 Akxi k1,2,

ni11n

(5)样本k阶中心矩 Bk(xi)k

ni1

k1,2,

X的左侧分位点F,P(XF)dF(x)。左分位点的概率含义是,随机变量

F

不超过该点的概率等于

设总体X分布已知,但其中有一个或多个参数未知,抽样X1,,Xn,希望通过样本来估计总体中的未知参数,称此为参数估计问题,它是统计推断理论中最重要的基础部分。

用样本矩作为总体矩的估计量,以及用样本矩的连续函数作为总体矩的连续函数的估计量,这种方法称为矩估计法,这是一种最自然的估计方法。

ˆ(x,,x))对任意成立。当样本是称ˆ是参数的一个无偏估计,如果E(1n

有限的时候,我们首先要考虑的是无偏性。

n1n22

ˆS(Xi)2才是方差的无偏估计。故我们在样本统计量中定义n1n1i1

S2为样本方差。

ˆ是参数的一个一致估计,如果依概率有limˆ(x1,,xn)对任意成立。

n

有效性

在所有关于参数的无偏估计类中0,或所有的一致估计类1中,如果存在

ˆ*是参数的一个无偏有效估计或一ˆ*)D(ˆ)对任意ˆ或任意ˆ成立,称D(01

ˆ具有最小方差性。 致渐近有效估计。即

*

。无论总体X分布是什么,任意样本Xi和都是X的无偏估计,但比单独的样本估计Xi更有效。

DXi,所以n

设总体X关于分布F(x,)存在两类问题,一类是分布的形式未知,一类是分布的形式已知但参数未知,提出的问题是,需要对分布的形式作出推断,此称为非参数检验的问题; 或需要对参数作出推断,此称为参数检验问题。

奈克—皮尔逊定理告诉我们,当样本容量n固定,若要减少犯第一类错误的概率则犯第二类错误的概率会增加,要使两类错误都减少当且仅当增加样本容量。

超过了我们设定的F,(如,体温超过37度。)此意味一个小概率事件发生了。于是,我们有理由拒绝命题H0是真的。

X~N(u1,12),Y~N(u2,2), 且相互独立,取样有(x1xn1),(y1yn2)。

欲检验H0:u1u2,或更一般,H0:u1u2u(u已知)。如何检验?

2(1)若1

2、2已知

因为~N(u1,

1

2n

1),~N(u2,

22

n2

), 且相互独立,所以~N(u1u2,

122

n1

n2

),

~N(0,1),

所以可找到检验统计量U

(2)若1222,但未知,欲检验H0:u1u20,

因为V

222

[(n1)S(n1)S]~(n1n22), 11222

且与

U

~N(0,1)独立,

n11n212

~t(n1n22), 令S2, S12S2

n1n22n1n22可得

11

V2S2,所以可找到统计量

n1n22

T

~t(n1n22)。

注:如果u未知,问题就变困难了,可以证明此时统计量T就是一个非中心的t分布。

(3)又如何知道1222?

12(n1)(n1)2可做假设检验H0:21。因为12S12~2(n11),22S2 ~2(n21)且独立。

122

S12

所以,可找到统计量F2~F(n11,n21)。

S2

(4)若122,且未知。问题就变困难多了,我们找不到合适的统计量。如果样本容量

足够大,那么,可以用渐近检验的办法处理。注意,U

中,因为12,2未

22

知,但已知S12,S2是12,2的一致估计,故用它们代替,有:

n1,n2

limU

~N(0,1)。

从而当n1,n2充分大时可用渐近正态检验。

又当n1n2n较小时,可以证明,

~t(n),注意,此与T

~t(n1n22)

自由度不同。此意味当期望、方差相同时,样本可以合并,认为X,Y属于同一总体。当期望相同,方差不同时,样本不能简单合并。

注:关于H0:u1u2u,或H0:u1u2u,统计量相同,并采用单侧的右分位点或单侧的左分位点检验。

ˆ是无偏线性估计类中的有效估计。 OLS

ˆ 的极大似然估计在基本模型假定下就是OLS

估计做出后,评价、判断模型中的假定是否合理是对事前设定的模型做一个整体的把握。我们可以把这些假定、设定归结为一些对未知参数的判断,如果这些判断基本正确或错误,那么从整体数据中就能够反映出来。假设检验是估计完成后对模型的设定做进一步的确认。它以证否的形式完成。拒绝原假设,意味着命题真时犯错误的可能性可控制在一定的概率范围内。

概率统计第五章大数定律及中心极限定理

中心极限定理

中心极限定理

中心极限定理

考研概率知识点总结:大数定律和中心极限定理

4中心极限定理

第二节 中心极限定理

中心极限定理证明

中心极限定理应用

大数定律和中心极限定理基本概念

《中心极限定理和概率统计.doc》
中心极限定理和概率统计
将本文的Word文档下载到电脑,方便收藏和打印
推荐度:
点击下载文档
下载全文