您好,欢迎来到小奈知识网。
搜索
您的当前位置:首页练习题答案12

练习题答案12

来源:小奈知识网
第十二章 线性回归分析

练习题

一、最佳选择题

1.SY,X表示( )。

ˆ对Y的离散程度 C.Y和X的离散程度 A.Y的离散程度 B.Yˆ的离散程度 E.X的离散程度 D.Y对Y2. 用最小二乘法确定直线回归方程的原则是各观察点距直线的( )。

A. 纵向距离之和最小 B.纵向距离的平方和最小 C.垂直距离之和最小 D.垂直距离的平方和最小确 E.纵向距离的平方和最大

3. Y=14+4X 是1-7岁儿童以年龄(岁)估计体重(市斤)的回归方程,若体重 换成国际单位kg,则此方程( )。

A. 截距改变 B. 回归系数改变 C. 两者都改变 D.两者都不改变 E.相关系数改变

4.直线回归系数假设检验,其自由度为( )。

A. n B. n-1 C. n-2 D. 2n-1 E. 2(n-1)

 5. 当r=0时,Y=a+bX 回归方程中( )。

A.a必大于零 B.a必等于X C.a必等于零 D.a必等于Y E.a必等于b

6.在多元线性回归分析中,应变量总离均差平方和可以分解为回归平方和与残差平方和 两部分,试回答残差系指 ( )。

ˆ之差 A.观察值Yi与估计值Yi B.观察值Yi与平均值Y之差

ˆ与平均值Y的平方和之差 C.估计值YiD.观察值Yi与平均值Y之差的平方和

ˆ之差的平方和 E.观察值Yi与估计值Yi

二 、问答题

1.用什么方法考察回归直线是否正确?

2.简述回归系数方差分析Y的平方和自由度的分解。

3.简述回归分析中Y的标准差SY与剩余标准差SY,X的区别和联系。

4. 简述SYˆ与SY的区别。

05.举例说明如何用直线回归方程进行预测和控制? 6.直线回归分析时怎样确定自变量和因变量? 7.简述曲线回归常用的几种曲线形式。 三、计算题

1.一个产科医师发现孕妇尿中雌三醇含量与产儿体重有关,并且两者之间成正相关。现收集了31例待产妇24小时的尿,测量其中的雌三醇含量,同时记录产儿的体重。结果如下表,求直线回归方程并对回归系数作假设检验。

待产妇尿中雌三醇含量与新生儿体重关系

编号 尿雌三醇 新生儿体重 编号 尿雌三醇 新生儿体重 (mg/24h) (kg ) (mg/24h) (kg) (1) (2) (3) (4) (2) (3) 1 7 2.5 17 17 3.2 2 9 2.5 18 25 3.2 3 9 2.5 19 27 3.4 4 12 2.7 20 15 3.4 5 14 2.7 21 15 3.4 6 16 2.7 22 15 3.5 7 16 2.4 23 16 3.5 8 14 3.0 24 19 3.4 9 16 3.0 25 18 3.5 10 16 3.1 26 17 3.6 11 17 3.0 27 18 3.7 12 19 3.1 28 20 3.8 13 21 3.0 29 22 4.0 14 24 2.8 30 25 3.9 15 15 3.2 31 24 4.3 16 16 3.2

2.为探讨某地饮水中氟含量与氟骨症的关系,试对测量得到的下列8对数据进行直线相 关分析 。

氟含量(mg/L)X: 0.47 0. 1.00 1.47 1.60 2.86 3.21 4.71

患 病 率(%)Y: 22.37 23.31 25.32 22.29 28.57 35.00 46.07 46.08

(1)按此资料绘制散点图?

(2)求直线回归方程并对回归系数作假设检验。

(3)试估计氟含量为2.00 mg/L时,患病率平均增加多少,计算其95%的可信区间,并 说明其含义。

(4)求氟含量为2.00 mg/L时,患病率Y值的95%的容许范围,并解释其含义。

练习题参

一、最佳选择题:

1.D 2.B 3.C 4.C 5.D 6.A

二 、问答题

1.答:用以下三种方法判定: (1)直线必须通过点(X,Y)。

(2)若纵坐标、横坐标无折断号,将此线左端延长与纵轴相交,焦点的纵坐标必等于截距a。

(3)直线是否在自变量X的实测范围内。

2.答:SS总即(Y-Y),为反应变量Y的离均差平方和,表示在未考虑X与Y的回归关系时Y的变异,可分解为两部分的变异,一部分为回归平方和,另一部分为剩余平方和,分别用SS回和SS剩表示。这三个平方和,各有其相应的自由度,其关系为:总=回+残,

2总n1,回=1,残=n-2。

3.答:SY表示在总体中,当X为某一定值时,个体Y值的波动范围。而剩余标准差SY,X是指当X对Y的影响被扣除后,Y方面仍有变异。这部分变异与X无关,纯属抽样变异。当

X与X接近且充分大时,可用SY,X代替SY。

4.答:Y是X对应Y的总体均数的一个样本估计值,S是反映其抽样误差大小的标准

Y误,其计算公式为SSYXY(x0X)211(x0X)2SYX;SY0是反映个体Y值2n(XX)nlXX的容许区间大小的,也就是说当总体中X为某定值时,Y值由于随机误差影响在Y0上下波动的范围的大小就取决于标准差

SY0,其计算公式为

SY0SYX(x0X)211(x0X)21SYX1。 2n(XX)nlXX5.答:步骤如下:

(1)根于研究目的确定预报因子(X)和预报量(Y),由X估计Y值,收集资料。

(2)建立预报方程YabX,并进行回归系数假设检验。若P小于检验水准,则回归

方程成立。

(3)根据回归方程在X实测范围内对Y进行预测,并计算X为某定值时,个体Y值波动范围(容许区间)。例如:1-7岁儿童,X为年龄,Y为体重,可根据年龄预测(估计)体重。

统计控制是利用回归方程进行逆估计,如要求因变量Y值在一定范围内波动,可以通过控制自变量X的取值来实现。步骤同前。例如:针刺哑门穴,进针深度Y与颈围X间存在直线关系,可根据X取值达到控制Y的目的。

6.答:

(1)Ⅰ型回归中,X为精密测定和严格控制的变量,Y为正态变量。表示原因的为X,表示结果的为Y。

(2)Ⅱ型回归中,X、Y均为服从正态分布的随机变量,互为因果,可计算两个回归方程。何者为X,何者为Y,根据研究目的确定。如身高、体重两变量,若目的只是由身高估计体重,则确定X为身高,Y为体重。

7.答:曲线回归常用的几种曲线形式有: (1)指数函数(Ye升而下降。

(2)幂函数(YaX),当b>0时,Y随X上升而上升;当b<0时,Y随X上升而下降。

(3)对数函数(YablnX),当b>0时,Y随X上升而上升,先快后慢;当b<

b(abX)),当b>0时,Y随X上升而上升;当b<0时,Y随X上

0时,Y随X上升而下降,先快后慢。

(4)logistic函数(Y1),当b>0时,Y随X上升而下降;当b<0时,Y随

1eabXX上升而上升。

三、计算题 1.解: (1)计算获得:

X534,X29876,Y99.2,Y2324.8,XY1750,

X3.2,Y17.23

XXYY1750XX253499.241.20

3153429876677.42

31XXYY4120.061 代入公式:b677.42XXaYbX3.20.06117.232.15 ˆabX21.50.061X Y(2)回归系数假设检验:

H0:0,即孕妇尿中雌三醇含量与产儿体重有直线关系

H1:0,即孕妇尿中雌三醇含量与产儿体重无直线关系 0.05

由上面的计算结果:

XX677.42,YY6.74,XXYY4.12

22241.2YYˆ6.74677.424.23

4.230.38SX.Y0.38,Sb0.15

312677.420.61所以,t4.14

0.15自由度v31229,查t值表,t0.01/2,292.756,P0.01,按0.05检验水准,

2拒绝H0,认为待产妇24小时尿中雌三醇含量与产儿体重之间存在线性回归关系。

2.解:

(1) 散点图如下

50403530252015105000.511.522.533.4.55氟含量(mg/L)氟含量与患病率的散点图患病率(%) (2) 由原始数据及散点图初步分析,估计本资料有直线趋势,故作下列计算

X15.96,X47.02,X2.00

Y249.01,Y8468.78,Y31.13,XY594.25

X15.96lX47.0215.18 n8Y249.01lY8468.78718.03 n8XY594.2515.96249.0197.48

lXYn822222XX222YYXY

blXY97.486.42 lXX15.18aYbX31.136.422.0018.29

回归系数假设检验:

H0:0,即氟含量与患病率之间无线性关系 H1:0,即氟含量与患病率之间有线性关系 0.05

SS总lYY718.028

lXY97.482 SS回625.983

lXX15.18 SS剩SS总SS回718.028625.98392.045

①方差分析(见表):

方差分析表

变异来源 回归 剩余 总变异

SS 625.983 92.045 718.028

df 1 6 7

MS 625.983 15.341

F 40.805

P <0.01

2计算得F16.147,查F界值表,得P<0.01,按0.05水准,拒绝H0,接受H1,可认为氟含量与患病率间有直线关系。 ② t检验:

H0:0,即氟含量与患病率之间无线性关系 H1:0,即氟含量与患病率之间有线性关系 0.05

SS总lYY718.028

lXY97.482 SS回625.983

lXX15.18SS剩SS总SS回718.028625.98392.045

2SS剩92.053.92 n282b0b6.42t6.38

SbSY•XlXX3.9215.18SY•X 按v6,查t界值表,得P0.001,按0.05水准,拒绝H0,接受H1,结论同上。

ˆabX18.296.42X来描述本题F40.816.39t,故可用直线回归方程Y患病率与增加氟含量的关系。

ˆ)绝对值特大的观测数据见表 异常点即对应于(YY残差的计算

ˆ YYˆ 序号 X Y Y1 0.47 22.37 21.31 1.06 2 0. 23.31 22.40 0.91 3 1.00 25.32 24.71 0.61 4 1.47 22.29 27.72 -5.44

5 1.60 28.57 28.56 0.01 6 2.86 35.00 36.65 -1.65 7 3.21 46.07 38.90 7.17 8 4.71 46.08 48.53 -2.45

由散点图及残差分析,第一点(X=1.47,Y=22.29)为可疑的异常点。 根据以上的计算结果,进一步求其总体回归系数的95%可信区间。 总体回归系数的95%可信区间

(bt0.05,(n2)Sb,bt0.05,(n2)Sb)(6.422.4473.9215.18,6.422.4473.9215.18)(3.96,8.88)Y23.213.96X,Y13.378.88X

按回归系数的95%可信区间下限和上限分别代入aYbX,得a123.21,a213.37。回归系数的95%可信区间上、下限对应的两条直线,回归方程为:

(3)估计氟含量为2.00mg/L时,患病率平均增加多少,计算其95%的可信区间,并说明含义。

SYSY*X1n(x0X)(XX)23.9218(2.002.00)215.181.39

当X=2.00mg/L时,Yˆ的95%可信区间:

ˆtˆt(Y31.13+2.447×1.39)=(27.73,34.53) Yˆ,ˆ)=(31.13-2.447×1.39,0.05/2,6SY0.05/2,6SY即总体中,氟含量为2.00mg/L时,患病率平均增加31.13mg/L,其95%的可信区间为(27.73,34.53mg/L)。

其含义为:当氟含量为2.00mg/L时,相应的平均增重服从一个正态分布(此正态分布的样本均数估计值为31.13mg/L),如果从此正态分布中重复抽样100次,这100个可信区间中理论上将有95个区间包含真正的总体均数(虽然这个总体均数真值是未知的)。 (4)求氟含量2.00mg/L时,患病率Y值的95%可信区间,并解释其含义。

SYSY*X11n(x0X)(XX)23.92118(2.002.00)215.184.16ˆ18.296.42X31.13,个体Y值的95%可信区间: 当x=2.00mg/L时,Yˆtˆt(Y31.13+2.447×4.16)=(21.95,41.31) Yˆ,ˆ)=(31.13-2.447×4.16,0.05/2,6SY0.05/2,6SY即估计,总体中,氟含量为2.00mg/L时,由95%的患病率增加体重在20.95,41.31mg/L范

围内。

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- huatuo3.com 版权所有 蜀ICP备2023022190号-1

违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务