2011-1-1
第六章 样本及抽样分布
(1)数理统计的基本概念 总体 在数理统计中,常把被考察对象的某一个(或多个)指标的全体称为总体(或母体)。我们总是把总体看成一个具有分布的随机变量(或随机向量)。 总体中的每一个单元称为样品(或个体)。 我们把从总体中抽取的部分样品x1,x2,,xn称为样本。样本中所含的样品数称为样本容量,一般用n表示。在一般情况下,总是把样本看成是n个相互独立的且与总体有相同分布的随机变量,这样的样本称为简单随机样本。在泛指任一次抽取的结果时,x1,x2,,xn表示n个随机变量(样本);在具体的一次抽取之后,x1,x2,,xn表示n个具体的数值(样本值)。我们称之为样本的两重性。 样本函数和统计量 设x1,x2,,xn为总体的一个样本,称 个体 样本 (x1,x2,,xn) 为样本函数,其中为一个连续函数。如果中不包含任何未知参数,则称(x1,x2,,xn)为一个统计量。 1
概率论与数理统计 公式(全)
2011-1-1
常见统计量及其性质 样本均值 样本方差 2 1nxxi. ni11n2S(xx). in1i1 样本标准差 1n2S(xx). in1i1 样本k阶原点矩 1nkMkxi,k1,2,. ni1样本k阶中心矩 1n(xix)k,k2,3,. Mkni1E(X),D(X)2n, E(S2)2,E(S*2)2n12, n1n2其中S*(XiX),为二阶中心矩。 ni1(2)正态总体下的四大分布 正态分布 设x1,x2,,xn为来自正态总体N(,)的一个样本,则样本函数 2ut分布 defx/n~N(0,1). 2设x1,x2,,xn为来自正态总体N(,)的一个样本,则样本函数 tdefxs/n~t(n1), 其中t(n-1)表示自由度为n-1的t分布。 1
概率论与数理统计 公式(全)
2011-1-1
2分布 设x1,x2,,xn为来自正态总体N(,)的一个样本,则样本函数 2w2def(n1)S22~2(n1), 2其中(n1)表示自由度为n-1的分布。 F分布 2设x1,x2,,xn为来自正态总体N(,1)的一个样本,而2y1,y2,,yn为来自正态总体N(,2)的一个样本,则样本函数 F其中 defS12/12S/2222~F(n11,n21), 1n1S(xix)2, n11i1211n2S(yiy)2; n21i122F(n11,n21)表示第一自由度为n11,第二自由度为n21的F分布。 (3)正态总体下分布的性质 X与S2独立。 第七章 参数估计
1
概率论与数理统计 公式(全)
2011-1-1
(1)点估计 矩估计 设总体X的分布中包含有未知数1,2,,m,则其分布函数可以表成F(x;1,2,,m).它的k阶原点矩vkE(Xk)(k1,2,,m)中也包含了未知参数1,2,,m,即vkvk(1,2,,m)。又设x1,x2,,xn为总体X的n个样本值,其样本的k阶原点矩为 1nkxi (k1,2,,m). ni1这样,我们按照“当参数等于其估计量时,总体矩等于相应的样本矩”的原则建立方程,即有 1nv1(1,2,,m)nxi,i11n2v2(1,2,,m)xi,ni1 nv(,,,)1xim.m12mni1由上面的m个方程中,解出的m个未知参数(1,2,,m)即为参数(1,2,,m)的矩估计量。 ˆ)为g()的矩估计。 若为的矩估计,g(x)为连续函数,则g(1
概率论与数理统计 公式(全)
2011-1-1
极大似然估计 当总体X为连续型随机变量时,设其分布密度为f(x;1,2,,m),其中1,2,,m为未知参数。又设x1,x2,,xn为总体的一个样本,称 L(1,2,,m)f(xi;1,2,,m) i1n为样本的似然函数,简记为Ln. 当总体X为离型随机变量时,设其分布律为P{Xx}p(x;1,2,,m),则称 L(x1,x2,,xn;1,2,,m)p(xi;1,2,,m) i1n为样本的似然函数。 若似然函数L(x1,x2,,xn;1,2,,m)在1,,,m处取2到最大值,则称1,,,m分别为1,2,,m的最大似然估计值,2相应的统计量称为最大似然估计量。 lnLni 0,i1,2,,m iiˆ)为g()的极大若为的极大似然估计,g(x)为单调函数,则g(似然估计。 (2)估计量的评选标准 无偏性 设(x1,x2,,xn)为未知参数的估计量。若E ()=,则称 为的无偏估计量。 E(X)=E(X), E(S)=D(X) 2有效性 设11(x1,x,2,,xn)和22(x1,x,2,,xn)是未知参数的两个无偏估计量。若D(1)D(2),则称1比2有效。 1
概率论与数理统计 公式(全)
2011-1-1
一致性 设n是的一串估计量,如果对于任意的正数,都有 nlimP(|n|)0, 则称n为的一致估计量(或相合估计量)。 ˆ)0(n),则为的一致估计。 若为的无偏估计,且D(只要总体的E(X)和D(X)存在,一切样本矩和样本矩的连续函数都是相应总体的一致估计量。 (3)区置信区间估计 间和置信度 设总体X含有一个待估的未知参数。如果我们从样本x1,x,2,,xn出发,找出两个统计量11(x1,x,2,,xn)与22(x1,x,2,,xn)(12),使得区间[1,2]以1(01)的概率包含这个待估参数,即 P{12}1, 那么称区间[1,2]为的置信区间,1为该区间的置信度(或置信水平)。 单正总体期望方差区间计 态的和的估2设x1,x,2,,xn为总体X~N(,)的一个样本,在置信度为1下,我们来确定和的置信区间[1,2]。具体步骤如下: (i)选择样本函数; (ii)由置信度1,查表找分位数; (iii)导出置信区间[1,2]。 21
概率论与数理统计 公式(全)
2011-1-1
已知方差,估计均值 (i)选择样本函数 ux0/n~N(0,1). (ii) 查表找分位数 xP1. 0/n(iii)导出置信区间 00x,x nn未知方差,估计均值 (i)选择样本函数 t xS/n~t(n1). (ii)查表找分位数 xP1. S/n(iii)导出置信区间 SSx,x nn方差的区间估计 (i)选择样本函数 w(n1)S22~2(n1). (ii)查表找分位数 (n1)S2P21. 21(iii)导出的置信区间 n1n1S,S 21第八章 假设检验
1
概率论与数理统计 公式(全)
2011-1-1
基本思想 假设检验的统计思想是,概率很小的事件在一次试验中可以认为基本上是不会发生的,即小概率原理。 为了检验一个假设H0是否成立。我们先假定H0是成立的。如果根据这个假定导致了一个不合理的事件发生,那就表明原来的假定H0是不正确的,我们拒绝接受H0;如果由此没有导出不合理的现象,则不能拒绝接受H0,我们称H0是相容的。与H0相对的假设称为备择假设,用H1表示。 这里所说的小概率事件就是事件{KR},其概率就是检验水平α,通常我们取α=0.05,有时也取0.01或0.10。 基本步骤 假设检验的基本步骤如下: (i) 提出零假设H0; (ii) 选择统计量K; (iii) 对于检验水平α查表找分位数λ; (iv) 由样本值x1,x2,,xn计算统计量之值K; 将K与进行比较,作出判断:当|K|(或K)时否定H0,否则认为H0相容。 两类错误 第一类错误 当H0为真时,而样本值却落入了否定域,按照我们规定的检验法则,应当否定H0。这时,我们把客观上H0成立判为H0为不成立(即否定了真实的假设),称这种错误为“以真当假”的错误或第一类错误,记为犯此类错误的概率,即 P{否定H0|H0为真}=; 此处的α恰好为检验水平。 当H1为真时,而样本值却落入了相容域,按照我们规定的检验法则,应当接受H0。这时,我们把客观上H0。不成立判为H0成立(即接受了不真实的假设),称这种错误为“以假当真”的错误或第二类错误,记为犯此类错误的概率,即 P{接受H0|H1为真}=。 两类错误的关系 人们当然希望犯两类错误的概率同时都很小。但是,当容量n一定时,变小,则变大;相反地,变小,则变大。取定要想使变小,则必须增加样本容量。 在实际使用时,通常人们只能控制犯第一类错误的概率,即给定显著性水平α。α大小的选取应根据实际情况而定。当我们宁可“以假为真”、而不愿“以真当假”时,则应把α取得很小,如0.01,甚至0.001。反之,则应把α取得大些。
第二类错误 1
概率论与数理统计 公式(全)
2011-1-1
单正态总体均值和方差的假设检验
条件 零假设 统计量 对应样本 函数分布 否定域 H0:0 已知 2|u|uUx0 12 H0:0 H0:0 H0:0 0/nN(0,1) uu1 uu1 |t|tTx0S/n 12(n1) 未知 2H0:0 H0:0 t(n1) tt1(n1) tt1(n1) 2w(n1)或H0:22 未知 22wH0:220 (n1)S202w 212(n1) 2(n1) w12(n1) 2w(n1) 2H0:20
1
因篇幅问题不能全部显示,请点此查看更多更全内容