八、简单直线相关与回归
1. sb表示样本回归系数的变异程度。(√)
2.凡是可以做线性回归的资料,均可做线性相关分析。(×) 3. 回归方程
的适用范围是x>0。(×)
4.回归系数与相关系数的假设检验等价,是因为b和r的符号相同。(×) 5. b为负值时,表示x每增加一个单位,y就平均减少|b|个单位。(√) 6.毫无关联的两个事物的数据也可算出一个回归方程,但毫无意义。(√) 7.回归分析中b<0,经检验P<0.01,则可认为能作相关分析的两变量呈负相关。(√)
8.服从双变量正态分布的资料都可以进行线性回归分析。(×) 9.对回归系数的假设检验有多种方法,实际应用时可任选一种。(√) 10.进行b的假设检验应先确定是用单侧还是双侧检验。(√) 11.同一资料算得r=0.8875,b=–2.1。(×) 12.配对计量资料也可进行相关或回归分析。(√)
13.1992年某市城郊铅污染与儿童学习成绩有线性关系,可认为铅污染是该地儿童成绩低下的原因。(×)
14.回归分析中,b越大,Sb也越大。(×) 15.回归系数越大,则两变量间关系越密切。(×)
16.根据同一资料,只能计算一个相关系数,同时配合一个回归方程。(×) 17. b的取值范围是_____B___。
a.–1<b<1 b.–∞<b<∞ c.b≥0 d.b≤0 e.b≠0
18.线性回归分析要求资料____C____。
a.x和y必须服从双变量正态分布 b.x必须服从正态分布 c.y必须服从正态分布 d.x和y都可以不服从正态分布 e.对资料没有要求
19.两组资料中,回归系数大的资料, B 。
a.相关系数也大 b.x变化引起y的变化幅度也大
1
c.进行t检验的t值也大 d.x变化引起y的变化幅度反而较小 e.x变化引起y的变化幅度可能大也可能小 20.以下哪一条不是回归分析的必要条件?____D_____ a.两变量呈线性关系 b.因变量为正态分布 c.观察值的独立性 d.两变量服从双变量正态分布 e.因变量的方差齐性
21.两组资料中回归系数b大的那组___D_____。 a.相关系数r也较大 b.相关系数r较小
c.两变量相关较密切 d.相关系数可能大也可能小 e.以上都不对 22. 作回归分析的程序通常为:____B____。
a.先进行相关分析,有相关关系时,再进行回归分析。 b.先绘制散点图,有线性趋势时,再进行回归分析。
c.绘制散点图,有线性趋势时,作相关分析,有相关关系时,再作回归分析。 d.直接作回归分析。
e.绘制散点图,有线性趋势时,相关、回归分析一起作。 23.用最小二乘法确定回归线性方程是指___B_____。 a.各散点都落在该直线上的方程
b.各散点与该直线的纵向距离的平方和最小的线性方程 c.各散点与该直线的垂直距离的平方和最小的线性方程 d.各散点尽量与该直线接近 e.b>0的线性方程 24. 线性回归分析可用于研究____B____之间的关系。 a.性别与职业 b.肺活量与胸围
c.职业与血型 d.国籍与基因型 e.母亲的血型与新生儿的血型 25. Syx表示____A____。
a.y对的变异程度 b.对的变异程度
c.y对的变异程度 d.y的总变异程度 e.以上都不对 26. ______C____,回归方程拟合得越好。 a.回归系数越大 b.回归系数越小
c.决定系数越大 d.决定系数越小 e.相关系数越小
2
27.如果线性相关系数r=1,则___C___。
a.SS总=SS残 b.SS残=SS回 c.SS总=SS回 d.SS总>SS回 e.MS回=MS残
28.线性回归与相关分析中,以下哪项正确?___D___ a.ρ=0时,r=0 b.∣r∣>0时,b>0
c.r>0时,b<0 d.r<0时,b<0 e.∣r∣=1时,b=1 29.某资料算得b=3.25,作t检验得P<0.05,说明两变量是___E_____。 a.正相关 b.负相关
c.无相关 d.可能是正相关也可能是负相关 e.还不能判断是否能作相关分析 30. sb是表示____A____。
a.回归系数的变异程度大小 b.两变量离散程度大小 c.各观察值与其估计值的变异程度大小 d.回归直线的坡度大小 e.相关关系的密切程度
31. 简单相关分析的前提条件:两个随机变量;散点图呈线性关系;服从双变量正态分布。(√)
32. 同一资料,有tr=tb=SQRT(F) 。(√) 33.直线回归分析的前提条件: E
A. 线 性(linearity):两个变量间存在线性关系; B. 独立性(independent):任意两个观察值互相独立; C. 正态性(normality):应变量y是服从正态分布的随机变量; D. 方差齐(equal variances):给定x后,应变量y的方差相等。 E. 以上均对
34. 1.为评价环境噪音强度对社区居民生活的影响程度,某市疾病预防控制中心监测了该市10个社区的环境噪音强度,同时调查各社区居民的失眠患病率(%),结果见表9-3。经对噪音强度数量化(+ =1,++ =2,+++ =3,++++ =4,+++++ =5)后,某医师对该资料采用Pearson直线相关分析,得r=0.853,P<0.005,认为环境噪音强度与居民失眠患病率之间存在正相关关系。
表1 某市10个社区环境噪音强度与居民失眠患病率
3
社区编号 噪音强度 失眠患病率(%) 【问题】
1 2 3 + 11.40
4 ++ 16.90
5 +++ 17.50
6 +++++ 26.30
7 + 13.60
8 +++ 25.60
9 ++ 11.60
10 ++++ 25.30
++++ +++ 21.20
23.40
(1)这是什么资料?(A)
(2)该医师处理方法是否正确?为什么?(C) (3)该资料应该用何种统计方法分析?(E) 【答案】
A. 该资料包含环境噪音强度与居民失眠患病率两个变量,1个属于计量资料,1个属于等级资料。
B. 该医师处理方法正确,因为居民失眠患病率可以看成计量资料,可以用Pearson直线相关分析,结论是正确的。
C. 该医师处理方法不正确,因为环境噪音强度为等级资料,不服从正态分布,因此,不能用Pearson直线相关分析。
D. 该资料应选用非参数统计方法,可采用直线相关与回归来分析两者的关系。 E. 该资料应选用非参数统计方法,可采用Spearman的等级相关(Spearman’s rank correlation)来分析两者的关系。
35. 2. 某研究者检测了10个不同污灌区的土壤中的镉含量(mg/kg)和该污灌区种植的谷穗中的镉含量(mg/kg),数据如表2。据此分析土壤中的镉含量(x)和谷穗中的镉含量(y)有无相关关系。
表2 土壤中的镉含量(x)和谷穗中的镉含量(y) 污灌区编号 土壤镉含量 (mg/kg) 谷穗镉含量 (mg/kg) 【问题】
4
1 2 3 4 5 6 7 8 9 10
0.20 0.23 0.40 0.48 0.65 0.80 0.62 0.45 0.50 0.42 0.050.060.070.070.080.090.060.070.050.060
0
0
8
5
3
9
1
8
5
(1)这是什么资料?(A)
(2)该资料应如何进行统计分析?(BC) 【答案】
A. 土壤中的镉含量和谷穗中的镉含量都是随机定量变量,属于双变量计量资料。 B. 两变量反映了研究对象的不同特征,无法用前述的t检验、方差分析、卡方检验等假设检验方法进行比较,这里将用到的是另一大类统计方法,用于分析反映研究对象不同特征的两个或多个变量间的关系。
C. 相关分析是其中用于分析两个或多个变量间相互关系的统计分析方法。直线相关分析是分析两个变量间有无直线关系的统计方法。 D. 可以用卡方检验来分析两个变量间有无直线关系。 E. 可以用秩和检验来分析两个变量间有无直线关系。
36. 4. 为研究血脂蛋白A与糖尿病足溃疡是否相关,某医师检测了10名糖尿病足病患者血清中血脂蛋白A的水平,数据如表3。对糖尿病足溃疡程度数量化(轻=1,中=2,重=3)后,该医师采用SPSS对该资料作Pearson直线相关分析,得r = 0.933,P<0.001,认为血脂蛋白A与糖尿病足溃疡之间存在正相关关系。 表3 10名糖尿病足病患者血脂蛋白A的水平与糖尿病足溃疡 患者编号
1
2 197.7 轻
3 179.4 轻
4 223.1 中
5 208.7 中
6 213.6 中
7 218.6 中
8 292.8 重
9 305.4 重
10 300.5 重
血脂蛋白A 189.(mg/dL) 足溃疡程度 【问题】
6 轻
(1) 这是什么资料?(A)
(2) 该医师处理方法是否正确?为什么?(B) (3) 该资料应该用何种统计方法分析?(E) 【答案】
A. 该资料包含血脂蛋白A与糖尿病足溃疡程度两个变量,一个属于计量资料,一个属于等级资料。
B. 该医师处理方法不正确,因为糖尿病足溃疡程度为等级资料,不服从正态分布,因此,不能用Pearson直线相关分析。
5
C. 该资料应选用参数统计方法,可采用t检验来分析两者的关系。
D. 该资料应选用非参数统计方法,可采用直线相关与回归来分析两者的关系。 E. 该资料应选用非参数统计方法,可采用Spearman的等级相关(Spearman’s rank correlation)来分析两者的关系。该资料应选用非参数统计方法,可采用Spearman的等级相关(Spearman’s rank correlation)来分析两者的关系。
37. 3. 某研究者检测了10个不同污灌区的土壤中的镉含量(mg/kg)和该污灌区种植的谷穗中的镉含量(mg/kg),数据如表2。据此分析土壤中的镉含量(x)和谷穗中的镉含量(y)有无相关关系。
表2 土壤中的镉含量(x)和谷穗中的镉含量(y) 污灌区编号 土壤镉含量 (mg/kg) 谷穗镉含量 (mg/kg) 【问题】
(1)这是什么资料?(A)
(2)该资料应如何进行统计分析?(BC) 【答案】
A. 土壤中的镉含量和谷穗中的镉含量都是随机定量变量,属于双变量计量资料。 B. 两变量反映了研究对象的不同特征,无法用前述的t检验、方差分析、卡方检验等假设检验方法进行比较,这里将用到的是另一大类统计方法,用于分析反映研究对象不同特征的两个或多个变量间的关系。
C. 相关分析是其中用于分析两个或多个变量间相互关系的统计分析方法。直线相关分析是分析两个变量间有无直线关系的统计方法。 D. 可以用卡方检验来分析两个变量间有无直线关系。 E. 可以用秩和检验来分析两个变量间有无直线关系。
38. 5. 某研究者检测了10个不同污灌区的土壤中的镉含量(mg/kg)和该污灌区种植的谷穗中的镉含量(mg/kg),数据如表4。据此分析土壤中的镉含量(x)和谷穗中的镉含量(y)有无相关关系。(ACE)
表4 土壤中的镉含量(x)和谷穗中的镉含量(y)
6
1 2 3 4 5 6 7 8 9 10
0.20 0.23 0.40 0.48 0.65 0.80 0.62 0.45 0.50 0.42 0.050.060.070.070.080.090.060.070.050.060
0
0
8
5
3
9
1
8
5
污灌区编号 1 2 3 4 5 6 7 8 9 10
土壤镉含量 0.20 0.23 0.40 0.48 0.65 0.80 0.62 0.45 0.50 0.42 (mg/kg)
谷穗镉含量 0.050.060.070.070.080.090.060.070.050.06(mg/kg)
0
0
0
8
5
3
9
1
8
5
SPSS输出结果如下: Correlations
Correlations
土壤镉含量
土壤镉含Pearson 量
Correlation Sig. (2-tailed) N
谷穗镉含Pearson 量
Correlation
Sig. (2-tailed) .002 N
10
10
10 .843**
.002 10 1
1
谷穗镉含量 .843**
**. Correlation is significant at the 0.01 level (2-tailed).
【答案】
A. Pearson直线相关分析结果中,从上到下依次为Pearson相关系数(Pearson Correlation)、双侧P值[Sig. (2-tailed)]和例数(N),数据区四个格子中的数据呈矩阵形式对称排列。
B. 本例,谷穗镉含量和土壤镉含量的Pearson相关系数r =1,P=0,无统计学意义。 C. 本例,谷穗镉含量和土壤镉含量的Pearson相关系数r =0.843,P=0.002,有统计学意义。
7
D. 按α=0.05水准,不拒绝H0,无统计学意义,尚不能认为调查污灌区的土壤镉含量和谷穗镉含量间存在正相关关系。
E. 按α=0.05水准,拒绝H0,接受H1,有统计学意义,可认为调查污灌区的土壤镉含量和谷穗镉含量间存在正相关关系,土壤镉含量增加,谷穗镉含量也增加。 39. 6. 某研究者检测了10个不同污灌区的土壤中的镉含量(mg/kg)和该污灌区种植的谷穗中的镉含量(mg/kg),数据如表4。据此分析土壤中的镉含量(x)和谷穗中的镉含量(y)有无回归关系。(ABCE)
表5 土壤中的镉含量(x)和谷穗中的镉含量(y) 污灌区编号 1
2
3
4
5
6
7
8
9
10
土壤镉含量 0.20 0.23 0.40 0.48 0.65 0.80 0.62 0.45 0.50 0.42 (mg/kg)
谷穗镉含量 0.050.060.070.070.080.090.060.070.050.06(mg/kg)
0
0
0
8
5
3
9
1
8
5
SPSS输出结果如下: Regression
Variables Entered/Removedb
Variables
Model Entered 1
Variables Removed
Method Enter
土壤镉含量a .
a. All requested variables entered. b. Dependent Variable: 谷穗镉含量
Model Summary
Std. Error
Adjusted R of the
Model R 1
.843a
R Square Square .710
.674
8
Estimate .007344
Model Summary
Std. Error
Adjusted R of the
Model R 1
.843a
R Square Square .710
.674
Estimate .007344
a. Predictors: (Constant), 土壤镉含量
ANOVAb
Sum of
Model 1
Squares
Regression .001 Residual .000 Total
.001
df 1 8 9
Mean Square F .001 .000
Sig.
19.604 .002a
a. Predictors: (Constant), 土壤镉含量 b. Dependent Variable: 谷穗镉含量
Coefficientsa
Standardized
Unstandardized Coefficients
Model 1
B
(Constant.042 )
土壤镉含.059 量
.013
Coefficients
t 6.196
Sig. .000
Std. Error Beta .007
.843
4.428 .002
9
Coefficientsa
Standardized
Unstandardized Coefficients
Model 1
B
(Constant.042 )
土壤镉含.059 量
a. Dependent Variable: 谷穗镉含量 【答案】
A. 第一个表格为变量引入/剔除模型表,由于只进入了1个自变量,故只有模型1(Model 1)。在模型1中,“土壤镉含量”为引入变量(Variables Entered),无剔除变量(Variables Removed),引入/剔除方法(Method)为Enter法。
B. 第二个表格为模型摘要表,模型1的复相关系数R=0.843,决定系数(R Square)R2=0.710。
C. 第三个表格为回归方程的方差分析结果,F=19.604,P=0.002,按α=0.05水准,拒绝H0,接受H1,可认为土壤镉含量和谷穗镉含量的直线回归方程有统计学意义。 D. 第四个表格为系数分析表,由表中可见:①回归直线截距a(常数项Constant的值)为0.007;回归系数b(土壤镉含量的B值)为0.013。②回归系数的t检验结果为t = 4.428,P=0.002,按α=0.05水准,拒绝H0,接受H1,可认为污灌区土壤镉含量和谷穗镉含量之间存在直线回归关系。③由土壤镉含量推谷穗镉含量的直线回归方程为y=0.007+0.013x。
E. 第四个表格为系数分析表,由表中可见:①回归直线截距a(常数项Constant的值)为0.042;回归系数b(土壤镉含量的B值)为0.059。②回归系数的t检验结果为t = 4.428,P=0.002,按α=0.05水准,拒绝H0,接受H1,可认为污灌区土壤镉含量和谷穗镉含量之间存在直线回归关系。③由土壤镉含量推谷穗镉含量的直线回归方程为y=0.042+0.059x。
10
Coefficients
t 6.196
Sig. .000
Std. Error Beta .007
.843
.013 4.428 .002
40. 1. 为评价环境噪音强度对社区居民生活的影响程度,某市疾病预防控制中心监测了该市10个社区的环境噪音强度,同时调查各社区居民的失眠患病率(%),结果见表1。经对噪音强度数量化(+ =1,++ =2,+++ =3,++++ =4,+++++ =5)后,某医师对该资料采用Pearson直线相关分析,得r=0.853,P<0.005,认为环境噪音强度与居民失眠患病率之间存在正相关关系。
表1 某市10个社区环境噪音强度与居民失眠患病率 社区编号 噪音强度 失眠患病率(%) 【问题】
(1)这是什么资料?(A)
(2)该医师处理方法是否正确?为什么?(C) (3)该资料应该用何种统计方法分析?(E) 【答案】
A. 该资料包含环境噪音强度与居民失眠患病率两个变量,1个属于计量资料,1个属于等级资料。
B. 该医师处理方法正确,因为居民失眠患病率可以看成计量资料,可以用Pearson直线相关分析,结论是正确的。
C. 该医师处理方法不正确,因为环境噪音强度为等级资料,不服从正态分布,因此,不能用Pearson直线相关分析。
D. 该资料应选用参数统计方法,可采用直线相关与回归来分析两者的关系。 E. 该资料应选用非参数统计方法,可采用Spearman的等级相关(Spearman’s rank correlation)来分析两者的关系。
41. 某研究者检测了10个不同污灌区的土壤中的镉含量(mg/kg)和该污灌区种植的谷穗中的镉含量(mg/kg),数据如表2。据此分析土壤中的镉含量(x)和谷穗中的镉含量(y)有无相关关系。
表2 土壤中的镉含量(x)和谷穗中的镉含量(y)
11
1 2 3 + 11.40
4 ++ 16.90
5 +++ 17.50
6 +++++ 26.30
7 + 13.60
8 +++ 25.60
9 ++ 11.60
10 ++++ 25.30
++++ +++ 21.20
23.40
污灌区编号 土壤镉含量 (mg/kg) 谷穗镉含量 (mg/kg) 【问题】
1 2 3 4 5 6 7 8 9 10
0.20 0.23 0.40 0.48 0.65 0.80 0.62 0.45 0.50 0.42 0.050.060.070.070.080.090.060.070.050.060
0
0
8
5
3
9
1
8
5
(1)这是什么资料?(A)
(2)该资料应如何进行统计分析?(BCE) 【答案】
A. 土壤中的镉含量和谷穗中的镉含量都是随机定量变量,属于双变量计量资料。 B. 两变量反映了研究对象的不同特征,无法用前述的t检验、方差分析、卡方检验等假设检验方法进行比较,这里将用到的是另一大类统计方法,用于分析反映研究对象不同特征的两个或多个变量间的关系。
C. 相关分析是其中用于分析两个或多个变量间相互关系的统计分析方法。直线相关分析是分析两个变量间有无直线关系的统计方法。 D. 可以用卡方检验来分析两个变量间有无直线关系。 E. 可以用直线相关来分析两个变量间有无直线关系。
42. 为探讨儿童缺锌对生长发育的影响,某医生随机抽取某幼儿园4岁男童12名,分析其身高与发锌含量之间的关系。数据如表3。 表3 某幼儿园12名4岁男童的发锌与身高值 编号 发锌(μmol/g) 身高(cm) 编号 发锌(μmol/g) 身高(cm) 【问题】
12
1 1.78 105.3 7 1.57 99.5
2 1.76 104.1 8 1.86 104.4
3 1.69 102.5 9 1.77 106.8
4 1.59 101.6 10 1.9 107.3
5 1.55 98.4 11 1.87 107.5
6 1.82 103.5 12 1.63 104
(1)这是什么资料?(A)
(2)该资料应如何进行统计分析?(BCE) 【答案】
A. 身高与发锌含量都是随机定量变量,属于双变量计量资料。
B. 两变量反映了研究对象的不同特征,无法用前述的t检验、方差分析、卡方检验等假设检验方法进行比较,这里将用到的是另一大类统计方法,用于分析反映研究对象不同特征的两个或多个变量间的关系。
C. 相关分析是其中用于分析两个或多个变量间相互关系的统计分析方法。直线相关分析是分析两个变量间有无直线关系的统计方法。 D. 可以用卡方检验来分析两个变量间有无直线关系。 E. 可以用直线相关来分析两个变量间有无直线关系。
43. 为研究血脂蛋白A与糖尿病足溃疡是否相关,某医师检测了10名糖尿病足病患者血清中血脂蛋白A的水平,数据如表4。对糖尿病足溃疡程度数量化(轻=1,中=2,重=3)后,该医师采用SPSS对该资料作Pearson直线相关分析,得r = 0.933,P<0.001,认为血脂蛋白A与糖尿病足溃疡之间存在正相关关系。 表4 10名糖尿病足病患者血脂蛋白A的水平与糖尿病足溃疡 患者编号
1
2 197.7 轻
3 179.4 轻
4 223.1 中
5 208.7 中
6 213.6 中
7 218.6 中
8 292.8 重
9 305.4 重
10 300.5 重
血脂蛋白A 189.(mg/dL) 足溃疡程度 【问题】
6 轻
(1) 这是什么资料?(A)
(2) 该医师处理方法是否正确?为什么?(B) (3) 该资料应该用何种统计方法分析?(E) 【答案】
A. 该资料包含血脂蛋白A与糖尿病足溃疡程度两个变量,一个属于计量资料,一个属于等级资料。
B. 该医师处理方法不正确,因为糖尿病足溃疡程度为等级资料,不服从正态分布,因此,不能用Pearson直线相关分析。
13
C. 该资料应选用参数统计方法,可采用t检验来分析两者的关系。
D. 该资料应选用非参数统计方法,可采用直线相关与回归来分析两者的关系。 E. 该资料应选用非参数统计方法,可采用Spearman的等级相关(Spearman’s rank correlation)来分析两者的关系。
44. 某研究者检测了10个不同污灌区的土壤中的镉含量(mg/kg)和该污灌区种植的谷穗中的镉含量(mg/kg),数据如表4。据此分析土壤中的镉含量(x)和谷穗中的镉含量(y)有无相关关系。(ACE)
表5 土壤中的镉含量(x)和谷穗中的镉含量(y) 污灌区编号 1
2
3
4
5
6
7
8
9
10
土壤镉含量 0.20 0.23 0.40 0.48 0.65 0.80 0.62 0.45 0.50 0.42 (mg/kg)
谷穗镉含量 0.050.060.070.070.080.090.060.070.050.06(mg/kg)
0
0
0
8
5
3
9
1
8
5
SPSS输出结果如下: Correlations
Correlations
土壤镉含量
土壤镉含Pearson 量
Correlation Sig. (2-tailed) N
谷穗镉含Pearson 量
Correlation
Sig. (2-tailed) .002 N
10
10
10 .843**
.002 10 1
1
谷穗镉含量 .843**
**. Correlation is significant at the 0.01 level (2-tailed).
14
【答案】
A. Pearson直线相关分析结果中,从上到下依次为Pearson相关系数(Pearson Correlation)、双侧P值[Sig. (2-tailed)]和例数(N),数据区四个格子中的数据呈矩阵形式对称排列。
B. 本例,谷穗镉含量和土壤镉含量的Pearson相关系数r =1,P=0,无统计学意义。 C. 本例,谷穗镉含量和土壤镉含量的Pearson相关系数r =0.843,P=0.002,有统计学意义。
D. 按α=0.05水准,不拒绝H0,无统计学意义,尚不能认为调查污灌区的土壤镉含量和谷穗镉含量间存在正相关关系。
E. 按α=0.05水准,拒绝H0,接受H1,有统计学意义,可认为调查污灌区的土壤镉含量和谷穗镉含量间存在正相关关系,土壤镉含量增加,谷穗镉含量也增加。 45. 某研究者检测了10个不同污灌区的土壤中的镉含量(mg/kg)和该污灌区种植的谷穗中的镉含量(mg/kg),数据如表4。据此分析土壤中的镉含量(x)和谷穗中的镉含量(y)有无回归关系。(ABCE)
表6 土壤中的镉含量(x)和谷穗中的镉含量(y) 污灌区编号 1
2
3
4
5
6
7
8
9
10
土壤镉含量 0.20 0.23 0.40 0.48 0.65 0.80 0.62 0.45 0.50 0.42 (mg/kg)
谷穗镉含量 0.050.060.070.070.080.090.060.070.050.06(mg/kg)
0
0
0
8
5
3
9
1
8
5
SPSS输出结果如下: Regression
Variables Entered/Removedb
Variables
Model Entered 1
Variables Removed
Method Enter
土壤镉含量a .
a. All requested variables entered.
15
Variables Entered/Removedb
Variables
Model Entered 1
Variables Removed
Method Enter
土壤镉含量a .
a. All requested variables entered. b. Dependent Variable: 谷穗镉含量
Model Summary
Std. Error
Adjusted R of the
Model R 1
.843a
R Square Square .710
.674
Estimate .007344
a. Predictors: (Constant), 土壤镉含量
ANOVAb
Sum of
Model 1
Squares
Regression .001 Residual .000 Total
.001
df 1 8 9
Mean Square F .001 .000
Sig.
19.604 .002a
a. Predictors: (Constant), 土壤镉含量 b. Dependent Variable: 谷穗镉含量
Coefficientsa
16
Standardized
Unstandardized Coefficients
Model 1
B
(Constant.042 )
土壤镉含.059 量
a. Dependent Variable: 谷穗镉含量 【答案】
A. 第一个表格为变量引入/剔除模型表,由于只进入了1个自变量,故只有模型1(Model 1)。在模型1中,“土壤镉含量”为引入变量(Variables Entered),无剔除变量(Variables Removed),引入/剔除方法(Method)为Enter法。
B. 第二个表格为模型摘要表,模型1的复相关系数R=0.843,决定系数(R Square)R2=0.710。
C. 第三个表格为回归方程的方差分析结果,F=19.604,P=0.002,按α=0.05水准,拒绝H0,接受H1,可认为土壤镉含量和谷穗镉含量的直线回归方程有统计学意义。 D. 第四个表格为系数分析表,由表中可见:①回归直线截距a(常数项Constant的值)为0.007;回归系数b(土壤镉含量的B值)为0.013。②回归系数的t检验结果为t = 4.428,P=0.002,按α=0.05水准,拒绝H0,接受H1,可认为污灌区土壤镉含量和谷穗镉含量之间存在直线回归关系。③由土壤镉含量推谷穗镉含量的直线回归方程为y=0.007+0.013x。
E. 第四个表格为系数分析表,由表中可见:①回归直线截距a(常数项Constant的值)为0.042;回归系数b(土壤镉含量的B值)为0.059。②回归系数的t检验结果为t = 4.428,P=0.002,按α=0.05水准,拒绝H0,接受H1,可认为污灌区土壤镉含量和谷穗镉含量之间存在直线回归关系。③由土壤镉含量推谷穗镉含量的直线回归方程为y=0.042+0.059x。
46. 为研究血脂蛋白A与糖尿病足溃疡是否相关,某医师检测了10名糖尿病足病患者
17
Coefficients
t 6.196
Sig. .000
Std. Error Beta .007
.843
.013 4.428 .002
血清中血脂蛋白A的水平,数据如表6。对糖尿病足溃疡程度数量化(轻=1,中=2,重=3)后,该医师采用SPSS对该资料作Pearson直线相关分析,得r=0.933,P<0.001,认为血脂蛋白A与糖尿病足溃疡之间存在正相关关系。 【问题】
(1)这是什么资料?(A)
(2)该医师处理方法是否正确?为什么?(B) (3)该资料应该用何种统计方法分析? (CDE) 表7 10名糖尿病足病患者血脂蛋白A的水平与糖尿病足溃疡 患者编号 血脂蛋白A (mg/dL) 足溃疡程度 1 2 3 4 5 6 7 8 9 10 189.197.179.223.208.213.218.292.305.300.6 轻 7 轻 4 轻 1 中 7 中 6 中 6 中 8 重 4 重 5 重 SPSS输出结果如下: Correlations
血脂蛋白足溃疡程A
Spearman's rho
血脂蛋白Correlation A
Coefficient Sig. (2-tailed) . N
足溃疡程Correlation 度
Coefficient
Sig. (2-tailed) .000 N
10
. 10
10 .944**
.000 10 1.000
1.000
度 .944**
**. Correlation is significant at the 0.01 level (2-tailed). 【答案】
A. 该资料为等级资料。
18
B. 该医师处理方法不正确,因为糖尿病足溃疡程度为等级资料,不服从正态分布,因此,不能用Pearson直线相关分析。
C. 该资料应选用非参数统计方法,可采用Spearman的等级相关(Spearman’s rank correlation)来分析两者的关系。
D. Spearman等级相关分析的结果,血脂蛋白A与足溃疡程度的Spearman 等级相关系数rs = 0.944,P < 0.001。
E. 按α=0.05水准,拒绝H0,接受H1,有统计学意义,可认为血脂蛋白A与糖尿病足溃疡程度之间存在正相关关系。
47. 某研究人员研究了抑郁程度与睡眠质量的关系,结果如表7。请分析抑郁程度与睡眠质量之间有无相关关系?
表8 抑郁程度与睡眠质量评分关系 编号 抑郁程度
1 轻
2 中
3 重
4 轻
5 轻
6 中
7 中
8 重
9 重
10 重
睡眠质量评分 1.2 1.3 1.4 1.1 【问题】
(1)这是什么资料?(A)
1.2 1.3 1.4 1.5 1.4 1.6
(2)该医师处理方法是否正确?为什么?(C) (3)该资料应该用何种统计方法分析?(E) 【答案】
A. 该资料包含抑郁程度与睡眠质量评分两个变量,1个属于等级资料,1个属于计量资料。
B. 该医师处理方法正确,因为睡眠质量评分可以看成计量资料,可以用Pearson直线相关分析,结论是正确的。
C. 该医师处理方法不正确,因为抑郁程度为等级资料,不服从正态分布,因此,不能用Pearson直线相关分析。
D. 该资料应选用参数统计方法,可采用直线相关与回归来分析两者的关系。 E. 该资料应选用非参数统计方法,可采用Spearman的等级相关(Spearman’s rank correlation)来分析两者的关系。
19
48.某医生在不同保存时间的条件下,测得白蛋白与球蛋白的比值如表9。问:(1)该研究属何种设计方案?(2)若想了解不同保存时间条件下与白球蛋白比值之间是否有关,应作何分析?(3)建立回归方程。(ABCDE) 表9 不同保存时间条件下的白球蛋白比值 血清保存时间(天) 白球蛋白比值
1
2
3
4
5
6
7
8
9
10 15 20
1.51.61.71.71.81.91.92.02.02.12.32.85
4
0
5
2
0
7
0
8
5
5
1
SPSS输出结果如下: Correlations
血清保存时白球蛋白比间
血清保存时Pearson 间
Correlation Sig. (2-tailed) N
白球蛋白比Pearson 值
Correlation
Sig. (2-tailed) .000 N
12
12
12 .995**
.000 12 1
1
值 .995**
**. Correlation is significant at the 0.01 level (2-tailed).
Model Summary
Std. Error
Adjusted R of the
Model R R Square Square
Estimate
20
1 .995a .990 .989 .03702
a. Predictors: (Constant), 血清保存时间 ANOVAb
Sum of
Model 1
Squares
Regression 1.315 Residual .014 Total
1.329
df 1 10 11
Mean Square F 1.315 .001
Sig.
959.821 .000a
a. Predictors: (Constant), 血清保存时间 b. Dependent Variable: 白球蛋白比值
Coefficientsa
Standardized
Unstandardized Coefficients
Model 1
B
(Constant) 1.507 血清保存时.063 间
a. Dependent Variable: 白球蛋白比值 【答案】
A. 该研究属于完全随机设计。目的是分析不同保存时间(x)条件下与白球蛋白比值(y)之间有无相关关系,服从双变量正态分布,应采用Pearson直线相关与回归分析。
Coefficients
t
Sig.
Std. Error Beta .019 .002
.995
81.207 .000 30.981 .000
21
B. Pearson直线相关分析,得r=0.995,P<0.001,按α=0.05水准,拒绝H0,接受H1,可认为血清保存时间与白球蛋白比值之间有相关关系。 C. 简单线性回归分析得R=0.995,R2=0.990。 D. 方差分析得F=959.821,P<0.001,有统计学意义。 E. 血清保存时间推算白球蛋白比值方程为y=1.507+0.063x
49. 为研究钙摄入与骨密度的关系,某医师测量了12例20~25岁成人每日钙摄入量(mg)和左前臂的骨密度(BMD)g/cm2),结果见表10。问:(1) 成人钙摄入量与左前臂BMD之间是否有相关关系?(2) 成人钙摄入量与与左前臂BMD之间是否有直线回归关系?如有,请写出直线回归方程。(ABCDE)
表10 12例成人钙摄入量(mg)和左前臂BMD(g/cm2)的测定结果 编 号 钙(mg) BMD
1
2
3
4
5
6
7
8
9
10
11
12
520 540 490 510 450 580 590 550 570 630 620 600 0.800.890.790.880.781.110.961.100.961.251.281.16
8
8
5
5
6
5
5
5
3
8
1
(g/cm2) 6
SPSS输出结果如下: Correlations 钙
Pearson Correlation Sig. (2-tailed) N
BMD
Pearson Correlation
Sig. (2-tailed) .000 N
12
12
12
.000 12
钙 1
BMD .889**
.889** 1
**. Correlation is significant at the 0.01 level (2-tailed).
22
Model Summary
Std. Error
Adjusted R of the
Model R 1
.889a
R Square Square .790
.769
Estimate 26.22601
a. Predictors: (Constant), BMD ANOVAb
Sum of
Model 1
Squares
Regression 25813.630 Residual 6878.037 Total
32691.667
df 1 10 11
Mean Square F
Sig.
25813.630 37.531 .000a 687.804
a. Predictors: (Constant), BMD b. Dependent Variable: 钙
Coefficientsa
Standardized
Unstandardized Coefficients
Model 1
B
(Constant281.263 ) BMD
272.336
44.454
Coefficients
t 6.225
Sig. .000
Std. Error Beta 45.186
.889
6.126 .000
a. Dependent Variable: 钙 【答案】
23
A. 该研究属于配对设计。目的是分析钙摄入量(mg)(x)和左前臂的骨密度(BMD)(g/cm2)(y)之间有无相关关系,服从双变量正态分布,应采用Pearson直线相关与回归分析。
B. Pearson直线相关分析,得r=0.889,P<0.001,按α=0.05水准,拒绝H0,接受H1,可认为每日钙摄入量(mg)和左前臂的骨密度(BMD)(g/cm2)之间有相关关系。 C. 简单线性回归分析得R=0.889,R2=0.790。 D. 方差分析得F=37.531,P<0.001,有统计学意义。
E. 钙摄入量(mg)(x)和左前臂的骨密度(BMD)(g/cm2)(y)方程为y=281.263+272.336x
50. 为研究铬的含量与分光光密度的关系,某人测量了10份样品的铬的含量(μg/g)和分光光密度值,结果见下表。
表11 10份样品的铬的含量(μg/g)和分光光密度值的测定结果
编 号 铬含量
1
2
3
4
5
6
7
8
9
10
0.060.080.961.270.230.070.851.130.160.463
6
7
0
4
3
3
8
8
5
光密度 0.010.010.130.170.020.010.100.160.010.072
6
8
2
8
4
6
4
9
9
SPSS的Bivariate过程进行Pearson直线相关分析,得r = 0.994,P=0.000。 SPSS的Linear过程进行简单直线回归分析,得:①复相关系数R=0.994,决定系数R2=0.987。②回归方程的方差分析:F=624.728,P=0.000。③a=0.002,b=0.136,tb=24.995,P=0.000。 【问题】
(1) 样品中铬的含量与分光光密度之间是否有相关关系?(A)
(2) 样品中铬的含量与分光光密度之间是否有直线回归关系?如有,请写出直线回归方程。(B)
(3) 若样品中铬的含量为0.987μg/g,其分光光密度为多少?(C) (4) 若某成年女性体重为2.320μg/g,其分光光密度为多少?(E) 【解答】铬的含量与分光光密度
24
A. SPSS的Bivariate过程进行Pearson直线相关分析,得r = 0.994,P=0.000,按α=0.05水准,拒绝H0,接受H1,可认为样品中铬的含量与分光光密度之间存在正相关关系,铬的含量越高,分光光密度也越高。
B. SPSS的Linear过程进行简单直线回归分析,得:①复相关系数R=0.994,决定系数R2=0.987。②回归方程的方差分析:F=624.728,P=0.000,按α=0.05水准,拒绝H0,接受H1,可认为两变量的直线回归方程有统计学意义。③a=0.002,b=0.136,tb=24.995,P=0.000。按α=0.05水准,拒绝H0,接受H1,可认为铬的含量与分光光密度之间存在直线回归关系。④铬的含量推算分光光密度的直线回归方程为y=0.002+0.136x。
C. 将x =0.987代入回归方程,求得y=0.136,即铬的含量为0.987时,其分光光密度为0.136。
D. 将x =2.320代入回归方程,求得y=0.318,即铬的含量为2.320时,其分光光密度为0.318
E. 由于铬含量的实测值范围是0.063~1.270,2.320已超出此范围,不宜用该回归方程来估计其分光光密度值。
51. 某地对重金属镉污染区进行土壤镉与人体尿镉关系的调查研究,抽查10个村的资料,各村抽查人数相同。土壤镉最低为4.14μg/L,最高为27.39μg/L。将土壤镉作x,人体尿镉为y,作相关回归分析,得r=0.787,P=0.007,b=0.228,a=6.503。 (1)能否用直线回归方程描述两者的关系,为什么?(A) (2)若土壤镉为6.58μg/L,则人体尿镉平均是多少?(BC) (3)若土壤镉为32.15μg/L,则人体尿镉平均又是多少?(E) 【答案】
A. 能用直线回归方程描述两变量间的关系。因为回归系数b的假设检验与相关系数r的假设检验等价,既然r的假设检验P=0.007,可认为两变量间有直线回归关系,所以能用直线回归方程来描述两变量间的关系。
B. 现已知a = 6.503,b = 0.228,故直线回归方程为y=6.503+0.228x。
C. 将x =6.58代入回归方程,求得y=8.003,即土壤镉为6.58μg/L,则人体尿镉平均是8.003μg/L。
D. 将x =32.15代入回归方程,求得y=13.833,即土壤镉为32.15μg/L,则人体尿镉平均是13.33μg/L。
25
E. 由于土壤镉的实测值范围是4.14μg/L~27.39μg/L,32.15μg/L 超出此范围,不宜用该回归方程来估计人体尿镉。
52. 某实验室给大鼠喂食高脂饲料,研究高脂饮食与心血管疾病的关系,测得10只大鼠周进食量(g)与收缩压(mmHg),数据见表12。以周进食量为自变量(x),收缩压为因变量(y),试做直线回归分析。(ABCE) 表12 10只大鼠高脂饲料周进食量与收缩压 编号
周进食量(g)
1
2
3
4
5
6
7
8
9
10
220 180 200 205 240 180 190 170 230 160
收缩压(mmHg) 130 122 128 119 135 108 121 115 125 105 SPSS输出结果如下: Model Summary
Std. Error
Adjusted R of the
Model R 1
.847a
R Square Square .718
.682
Estimate 5.33988
a. Predictors: (Constant), 周进食量(g) ANOVAb
Sum of
Model 1
Squares
Regression 579.485 Residual 228.115 Total
807.600
df 1 8 9
Mean Square F 579.485 28.514
Sig.
20.323 .002a
a. Predictors: (Constant), 周进食量(g) b. Dependent Variable: 收缩压(mmHg)
Coefficientsa
26
Standardized
Unstandardized Coefficients
Model 1
B
(Constant) 60.722 周进食量(g)
a. Dependent Variable: 收缩压(mmHg) 【答案】
A. 简单线性回归分析得R=0.847,R2=0.718。
B. 方差分析得F=20.323,P=0.002,有统计学意义,两个变量存在回归关系。 C. 回归系数假设检验tb=4.508,P=0.002。
D. 周进食量(g)(x)与收缩压(mmHg)(y)回归方程为y=13.433+0.067x。 E. 周进食量(g)(x)与收缩压(mmHg)(y)回归方程为y=60.722+0.304x。 53. 某地对血吸虫流行区进行血吸虫与大肠癌关系的调查研究,抽查39个乡的资料,各乡抽查人数相同。血吸虫感染率最低为8.9%,最高为79.3%。将血吸虫感染率(%)作x,大肠癌标化死亡率(1/10万)为y作相关回归分析,得r=0.6315,P<0.01,b=0.1344,a=4.152。 【问题】
(1)能否用直线回归方程描述两者的关系,为什么?(A)
(2)若血吸虫感染率为20%,则大肠癌标化死亡率平均是多少?(BC) (3)若血吸虫感染率为90%,大肠癌标化死亡率平均又是多少?(E) 【答案】
A. 能用直线回归方程描述两变量间的关系,因为回归系数的假设检验与相关系数的假设检验等价,既然r的假设检验P<0.01,可认为两变量有直线关系,所以能用直线回归方程来描述两变量间的关系。
B. 用血吸虫感染率(%)(x)推大肠癌标化死亡率(1/10万)(y)的回归方程为: y=4.152+0.1344x
27
Coefficients
t 4.520 4.508
Sig. .002 .002
Std. Error Beta 13.433 .067
.847
.304
C. 将x=20代入方程,求得y=6.84,则血吸虫感染率为20%时,大肠癌标化死亡率平均是6.84/10万。
D 将x=90代入方程,求得y=16.25,则血吸虫感染率为20%时,大肠癌标化死亡率平均是16.25/10万。
E. 由于血吸虫感染率的实测值范围是8.9%~79.3%,90%已超出此范围,不宜用该回归方程来估计大肠癌标化死亡率。
54. 为探讨儿童缺锌对生长发育的影响,某医生随机抽取某幼儿园4岁男童12名,分析其发锌含量(x)与身高(y)之间的关系。数据如表3。(ABCE) 表3 某幼儿园12名4岁男童的发锌与身高值 编号 发锌(μmol/g) 身高(cm) 编号 发锌(μmol/g) 身高(cm)
1 1.78 105.3 7 1.57 99.5
2 1.76 104.1 8 1.86 104.4
3 1.69 102.5 9 1.77 106.8
4 1.59 101.6 10 1.9 107.3
5 1.55 98.4 11 1.87 107.5
6 1.82 103.5 12 1.63 104
SPSS输出结果如下: Model Summary
Std. Error
Adjusted R of the
Model R 1
.859a
R Square Square .737
.711
Estimate 1.55459
a. Predictors: (Constant), 发锌(μmol/g) ANOVAb
Sum of
Model
Squares
df
Mean Square F
28
Sig.
1 Regression 67.742 Residual 24.167 Total 91.909 1 10 11 67.742 2.417 28.030 .000a a. Predictors: (Constant), 发锌(μmol/g) b. Dependent Variable: 身高(cm)
Coefficientsa
Standardized
Unstandardized Coefficients
Model 1
(Constant) 发锌(μmol/g)
a. Dependent Variable: 身高(cm) 【答案】
A. 简单线性回归分析得R=0.859,R2=0.737。
B. 方差分析得F=28.030,P=0.000即P<0.001,有统计学意义,两个变量存在回归关系。
C. 回归系数假设检验tb=5.294,P<0.001。
D. 发锌含量(x)与身高(y)回归方程为y=6.594+3.797x。 E. 发锌含量(x)与身高(y)回归方程为y=68.913+20.103x。
29
Coefficients
t
Sig.
B 68.913 20.103
Std. Error Beta 6.594 3.797
.859
10.451 .000 5.294
.000
因篇幅问题不能全部显示,请点此查看更多更全内容