统计总结

2020-03-01 20:02:33 来源：范文大全收藏下载本文

（一）概念

1变量与变量值：被观察和测量单位的特征称变量。对变量的测得值称变量值

2同质与变异：被研究指标的影响因素相同或具有相同性质的事物称为同质。在同质的基础上各观察单位之间的差异或同质事物之间的差别称为变异。

3总体：根据研究目的确定的同质的研究对象（观察单位）的全体（无限总体、有限总体）4样本:从总体中按照一定的目的随机抽取的有代表性的部分观察单位(随机性、可比性、可靠性）。

5系统误差:指数据搜集和测量过程中由于仪器不准确、标准不规范等原因，造次观察结果呈倾向性的偏大或偏小，这种误差称为系统误差。

6随机测量误差:由于非人为的偶然因素所致误差。对于同一样本多次测定结果不完全一样，结果有时偏大有时偏小，这种误差叫随机测量误差

7抽样误差：在抽样过程中由于个体差异所致的统计量与参数之间的差异。

8概率：是描述随机事件发生可能性大小的一个度量。医学研究中，将概率小于等于0.05或0.01的事件称为小概率事件。

9计量资料：用定量的方法测得某项指标量的大小所得到的资料成为计量资料。

10计数资料：将观察单位按属性或类别分组，然后清点各组观察单位的个数所得到的资料。 11等级资料：是将观察单位按某种属性的不同程度分成等级后分组计数，分类汇总各组观察单位数后而得到的资料。

12中位数：将一组观察值从小到大按顺序排列，位次居中的数值即为中位数。

13众数：原指总体中出现机会最高的数值。样本众数则是在样本中出现次数最多的数值。 14调和均数：先求原始数据倒数的算术均数。该算术均数的倒数便称为原数据的调和均数。 15自由度：计算某个统计量，取值不受限制的变量的个数成为自由度。

16用样本统计量估计总体参数称参数估计, 是统计推断的一个重要内容。常用的估计方法

有两种：点估计和可信区间估计。点估计是指用样本统计量直接作为总体参数的估计值。可信区间估计亦称置信区间估计，是指按预先给定的概率（1－α) 称可信度,估计未知总体参数的可能范围。

17偏度系数：偏度指分布不对称的程度和方向，理论上总体偏度系数为0时，分布是对称的；取正值时，分布为负偏峰；取负值时分布为正偏峰。

18峰度系数：峰度指分布与正态曲线相比的冒尖程度或扁平程度指理论上, 正态分布的总体峰度系数为0；取负值时，其分布较正态分布的峰平阔；取正值时，其分布较正态分布的峰尖峭。

19医学统计学：将概率论和数理统计的原理和方法应用于医疗卫生实践和医学科研，研究其数据的搜集、整理与分析的一门科学。它是认识人群健康与疾病数量特征的重要工具，是进行医药卫生科学研究的重要手段。

20统计工作基本流程：设计，搜集资料，整理资料，分析资料。

21．95％可信区间：作100次抽样，获得100个样本,可算得100个可信区间，其中，有95个可信区间包含μ(估计正确)，可能只有5个可信区间不包含μ(估计错误)。

（二）计量资料的统计描述：

一统计表

1含义是指如下一种格式的统计表：即先根据观察个体的数量大小进行分组，然后计算每组的观察值出现的次数，并用表格形式表达。

2制做过程：（1）找出数据的极差，极差又称为全距，是指全部数据的最大值与最小值之差，其可以描述数据的变异程度。（2）确定组数，ｋ表示组数，组数通常选择在8－15之间。（3）确定组距（4）划分组段（5）编制表将数据划归各组

3频数分布表的用途：（1）作为表达资料的形式，可以代替繁杂的原始资料，便于进一步分析。（2）便于观察数据的分布类型。医学研究中常见的资料分布类型可分为对称分布和偏态分布两大类。在对称分布资料中有一种非常重要的分布类型即正态分布，偏态分布，正偏态分布，负偏态分布。（3）便于发现资料中某些远离群体的特大或特小的可疑值。

二,集中趋势的描述(均数是描述一组观察值集中趋势或平均水平的统计指标体系，它常作为一组数据的代表值用于分析和进行组间的比较)

1.算数均数:应用于对称分布，尤其适用正态分布（近似正态分布）资料。

2几何均数：可用于描述一组资料数据经对数转换后呈现为对称分布或正态分布的变量值的平均水平。在医学研究领域多用于血清学和微生物学中；有些呈轻度偏态分布的资料经过对数变换后呈对称分布资料。

3中位数和百分位数：将一组观察值从小到大按顺序排列，位次居中的数值即为中位数。百分位数可用来描述资料的观察值序列在某百分位置的水平。

4众数与调和均数

三，离散趋势的描述

1极差2四分位数间距 3平均偏差4方差与标准差5变异系数

四，正态分布（是以均数为中心对称的钟型分布）

1特征：（1）对称性正态分布是以均数为中心，表现为左右对称（2）集中性正态曲线在横轴上方均数处为最高，频数集中于中等大小数据的附近（3）正态分布有两个参数一个是位置参数。当恒定后，越大，正态曲线沿横轴向右移；否则反之。一个是形态参数，当恒定后，越大则数据越分散，曲线显现越平阔；越小，曲线显现越尖峭。而且曲线的变动呈均匀性，即均匀分布（4）正态曲线在1处个有一个拐点（5）正态曲线下的面积必定等于1；正态分布下的面积分布有一定规律。

2医学参考值范围：传统上称为正常值范围，指特定的“正常”人群（排除了对研究指标有影响的疾病和有关因素特定的同质人群）的解剖、生理、生化、免疫及组织代谢产物的含量等各种数据的波动范围。

3应用：（1）有不少医学现象服从正态或近似正态分布，利用正态分布原理，可以估计医学参考值范围。（2）利用正态曲线下面积分布规律，估计变量值频数的分布情况。（3）实验中的测量误差，一般也是服从正态分布的，利用这一点，可以准确地进行误差分析和检测的质量控制。（4）正态分布是许多统计方法的基础。@某些统计量的抽样分布是在正态分布的基础上推导出来的@t分布、二项分布等的极限形式表现为正态分布@对一些偏态分布的资料，有时也可通过变量变换，转换成正态分布，然后按正态分布规律处理。

（三）ｔ分布

1.ｔ分布是以0为中心随自由度而变化的一簇左右对称的曲线。ｔ分布只有一个参数即

自由度，用表示，= n-1。自由度越大，ｔ分布越接近于正态分布；当自由度逼近时，ｔ分布趋向于标准正态分布。

2.特征：①单峰分布，以0为中心，左右对称，类似于标准正态分布。②自由度 越小，

则越大，t值越分散，曲线的峰部越矮，尾部越高；③随着自由度 逐渐增大，t分布逐渐逼近标准正态分布；当 趋于 时，t分布就完全成为标准正态分布，故标准正态分布是t分布的特例。

3.可信区间两要素：（1）准确度，反映在可信度的大小，即可信区间包括总体参数概率的

大小，其概率愈接近１准确度愈高（2）精密度，反映区间的长度，区间长度愈小精密度愈高。

（四）假设检验

一原理：首先假设被比较的两个或几个均数（率）分别来自同一个总体，而它们间的差异

仅仅是由于抽样误差所致，然后根据资料数据的类型、分布、样本含量的大小和科研设计的要求等，选择检验的方法，计算相应的统计量，去推断这种抽样误差的可能性大小，即P值的大小，如果P值较大，则认为它们间的差异是由于抽样误差所致的可能性较大，而实际存在本质差异的可能性较小，故接受假设；否则反之。

二步骤

1 建立检验假设，确定检验水准。(1) 建立检验假设假设有两个：1)无效假设H0；即样本均数所代表总体均数与假设的总体均数相同，认为其差异是由于抽样误差所致。 2)备择假设H1；它是在拒绝H0的情况下而被接受的假设，即样本均数所代表总体均数不同于假设的已知总体均数，表明与差异是本质性差异。（2）确定检验水准，亦称显著性水准α，检验水准即表示检验有意义的水准，检验水准的取值应根据不同的研究目的而定。

2选择检验方法，计算检验统计量。检验方法的选择应根据研究设计方案、统计推断的目的、资料类型、样本含量和资料分布等选择适当方法，依据选择的方法公式计算其相应的检验统计量。

3确定Ｐ值，做出统计推断结论，假设检验的结论具有概率性，无论是拒绝H0或是不拒绝H0，均有一定的风险性。

(五)ｔ检验（它以ｔ分布为基础的假设检验方法，理论上，ｔ检验的应用条件是计量资料，要求样本来自正态分布总体，两样本均数比较时，还要求两总体方差具有齐性；但在实际工作中，只要其分布为单峰呈近似对称分布也可应用。）

1单个样本ｔ检验：是指样本均数了代表的总体均数和已知总体均数的比较。

2配对设计：配对设计主要有四种情况：①同一受试对象身体两个部位的数据。②同一受试对象处理（实验或治疗）前后的数据。③同一样品用两种方法检验的结果④两种同质受试对象分别接受两种处理。

3两独立样本ｔ检验：要求计量资料，样本来自正态分布总体，两样本均数比较时要求两总体方差相等。不齐时用矫正t 检验。

4显著性检验的注意事项：（1）要有严密的抽样研究设计，保证组间的可比性（2）选用的假设检验方法应符合其适用条件（3）正确选择检验水准（4）正确理解差别有无显著性的统计意义(5)报告结论时应写明P值的确切范围(6)所下结论不能绝对化。

将本文的Word文档下载到电脑，方便收藏和打印

推荐度：

点击下载文档

统计总结

相关推荐