2020-03-04 01:05:47 来源:范文大全收藏下载本文
若{Xn}的分布函数序列{Fn(x)}与X的分布函数F(x)有,在任意连续点x,limFn(x)F(x)。 n
依概率收敛
n若0,有P(XnX)0。准确的表述是,0,0,
N,nN,有P(XnX)成立
(3)几乎必然收敛
如果有P(limXnX)1。准确的表述是,除掉一个0概率集A,对所有的\\A,n
有limXn()X()成立。这是概率空间上的点收敛。 n
定理1。(切贝雪夫大数律){Xn}相互独立,且有相同的期望和方差,(不一定同分布)
1nPE(Xn)uD(Xn),n,记YnXi,则Ynu。 ni1
2统计发生——事物某方面的定量记录事前是不确定的,发生后的数据由真值和误差两部分构成,X。X是数据,是真值,是误差。导致误差的原因有:
1. 系统性误差:偏离真值的本质性错误,有内在原因所致;
2. 随机性误差:偏离真值的偶然性错误,没有内在原因,是纯偶然因素所致。
总体就是一个特定的随机变量
通过抽样,获得样本,构造样本统计量,由此推断总体中某些未知的信息
从总体中抽样是自由的,且当总体数量足够大,有放回与无放回抽样区别不大,有理由认为,取得的抽样观察值是没有关系的。所以,样本在未抽取前它们是与总体X同分布的随机变量,且是相互独立的,称此为随机样本。
定义2。设x1,,xn是取自总体X的一组样本值, g(x1,,xn)是Borel 可测函数,则称随机变量g(X1,,Xn)是一个样本统计量。
如果总体X中分布函数有某些参数信息是未知的,我们用统计量g(X1,,Xn)去推断这些信息,称此问题为统计推断问题。
给样本值x(x1,,xN),y(y1,,yN),定义: (1)样本均值
(xi/n)
i
1n
(2)样本方差
1n
ˆx)ˆvar((xi)2 n1i1
ˆ样本标准差
s.e.e)
x)i( y)
1n
(3)样本协方差cˆov(x,y)(1x
n1i1
样本相关系数
xy
ˆ(x,y)cov
1/2
ˆ(x)varˆ(y)][var
1nk
(4)样本k阶矩 Akxi k1,2,
ni11n
(5)样本k阶中心矩 Bk(xi)k
ni1
k1,2,
X的左侧分位点F,P(XF)dF(x)。左分位点的概率含义是,随机变量
F
不超过该点的概率等于
设总体X分布已知,但其中有一个或多个参数未知,抽样X1,,Xn,希望通过样本来估计总体中的未知参数,称此为参数估计问题,它是统计推断理论中最重要的基础部分。
用样本矩作为总体矩的估计量,以及用样本矩的连续函数作为总体矩的连续函数的估计量,这种方法称为矩估计法,这是一种最自然的估计方法。
ˆ(x,,x))对任意成立。当样本是称ˆ是参数的一个无偏估计,如果E(1n
有限的时候,我们首先要考虑的是无偏性。
n1n22
ˆS(Xi)2才是方差的无偏估计。故我们在样本统计量中定义n1n1i1
S2为样本方差。
ˆ是参数的一个一致估计,如果依概率有limˆ(x1,,xn)对任意成立。
n
有效性
在所有关于参数的无偏估计类中0,或所有的一致估计类1中,如果存在
ˆ*是参数的一个无偏有效估计或一ˆ*)D(ˆ)对任意ˆ或任意ˆ成立,称D(01
ˆ具有最小方差性。 致渐近有效估计。即
*
。无论总体X分布是什么,任意样本Xi和都是X的无偏估计,但比单独的样本估计Xi更有效。
DXi,所以n
设总体X关于分布F(x,)存在两类问题,一类是分布的形式未知,一类是分布的形式已知但参数未知,提出的问题是,需要对分布的形式作出推断,此称为非参数检验的问题; 或需要对参数作出推断,此称为参数检验问题。
奈克—皮尔逊定理告诉我们,当样本容量n固定,若要减少犯第一类错误的概率则犯第二类错误的概率会增加,要使两类错误都减少当且仅当增加样本容量。
超过了我们设定的F,(如,体温超过37度。)此意味一个小概率事件发生了。于是,我们有理由拒绝命题H0是真的。
X~N(u1,12),Y~N(u2,2), 且相互独立,取样有(x1xn1),(y1yn2)。
欲检验H0:u1u2,或更一般,H0:u1u2u(u已知)。如何检验?
2(1)若1
2、2已知
因为~N(u1,
1
2n
1),~N(u2,
22
n2
), 且相互独立,所以~N(u1u2,
122
n1
n2
),
~N(0,1),
所以可找到检验统计量U
。
(2)若1222,但未知,欲检验H0:u1u20,
因为V
222
[(n1)S(n1)S]~(n1n22), 11222
且与
U
~N(0,1)独立,
n11n212
~t(n1n22), 令S2, S12S2
n1n22n1n22可得
11
V2S2,所以可找到统计量
n1n22
T
~t(n1n22)。
注:如果u未知,问题就变困难了,可以证明此时统计量T就是一个非中心的t分布。
(3)又如何知道1222?
12(n1)(n1)2可做假设检验H0:21。因为12S12~2(n11),22S2 ~2(n21)且独立。
122
S12
所以,可找到统计量F2~F(n11,n21)。
S2
(4)若122,且未知。问题就变困难多了,我们找不到合适的统计量。如果样本容量
足够大,那么,可以用渐近检验的办法处理。注意,U
中,因为12,2未
22
知,但已知S12,S2是12,2的一致估计,故用它们代替,有:
n1,n2
limU
~N(0,1)。
从而当n1,n2充分大时可用渐近正态检验。
又当n1n2n较小时,可以证明,
~t(n),注意,此与T
~t(n1n22)
自由度不同。此意味当期望、方差相同时,样本可以合并,认为X,Y属于同一总体。当期望相同,方差不同时,样本不能简单合并。
注:关于H0:u1u2u,或H0:u1u2u,统计量相同,并采用单侧的右分位点或单侧的左分位点检验。
ˆ是无偏线性估计类中的有效估计。 OLS
ˆ 的极大似然估计在基本模型假定下就是OLS
估计做出后,评价、判断模型中的假定是否合理是对事前设定的模型做一个整体的把握。我们可以把这些假定、设定归结为一些对未知参数的判断,如果这些判断基本正确或错误,那么从整体数据中就能够反映出来。假设检验是估计完成后对模型的设定做进一步的确认。它以证否的形式完成。拒绝原假设,意味着命题真时犯错误的可能性可控制在一定的概率范围内。
人人范文网 m.inrrp.com.cn 手机版