搜索
您的当前位置:首页正文

SPSS软件在葡萄与葡萄酒理化指标的相关性分析中的应用

来源:小奈知识网
第26卷第5期 长沙大学学报 VOI.26 NO.5 2 0 1 2年9月 JOURNAL OF CHANGSHA UNlVERSITY Sep.2 0 1 2 SPSS软件在葡萄与葡萄酒理化指标的 相关性分析中的应用 何少芳,李梦祝 (湖南农业大学理学院,湖南长沙410128) 摘要:利用SPSS软件对酿酒葡萄样品与葡萄酒样品的理化指标进行相关性分析,根据分析结果得出酿酒葡萄与葡萄 酒的理化指标之间的内在联系。 关键词:酿酒葡萄;葡萄酒;主成分分析;典型相关分析 中图分类号:O213 文献标识码:A 文章编号:1008—468l(2012)05—00l1—04 葡萄酒是用新鲜的葡萄或葡萄汁经发酵酿成的酒精饮 1.2数据处理方法 料,通常分为红葡萄酒和白葡萄酒两种.在日常生活中,我们 根据酿酒葡萄与葡萄酒样品的各理化指标数据,利用 会从葡萄酒的外观、香气、口感等方面来评价酒质量的好坏, SPSS10.0软件进行统计分析与数据处理. 而酒的这些特质很大程度上是酿酒葡萄的各项理化指标的 数据结果的主成分分析:采用统计分析软件SPSS10.0的 外在体现,如花色苷等物质的含量体现了葡萄酒的外观,总 Data Reduction中的Factor分析; 糖、各类酸、单宁等共同决定了葡萄酒的口感,芳香物质决定 数据结果的典型相关分析:通过调用统计分析软件的 了葡萄酒的香气….然而由于其他因素的存在,葡萄酒的理 “Canonical correlation.sps”宏包进行分析. 化指标并不完全等同于酿酒葡萄的理化指标.为了了解酿酒 葡萄与葡萄酒的理化指标之间的内在联系,我们对某一年份 2输出结果与分析 酿酒葡萄和葡萄酒样品的理化指标数据进行分析,考虑到酿 2.1主成分分析 酒葡萄的理化指标和葡萄酒的理化指标为两组多因素变量, 主成分分析是将多项指标重新组合成一组新的互相无 我们利用SPSS软件对其进行典型相关分析.由于酿酒葡萄 关的几个综合指标,根据实际需要从中选取尽可能少的综合 和葡萄酒的理化指标中包含的参数比较多,可先用主成分分 指标,以达到尽可能多地反映原指标信息的分析方法 .由 析法将原来多个理化指标减至少数的几个主要成份,各个主 于酿酒葡萄和葡萄酒样品的理化指标数据中包含的指标比 要成份中包括原来的几种理化指标,然后利用SPSS软件做 较多,因此我们用SPSS软件的主成分分析将原来多个理化 典型相关性分析,分析酿酒葡萄和葡萄酒的主成分这两组变 指标减至少数的几个主要成份.在SPSS软件中输入酿酒葡 量的典型变量之间的相关关系,从而得出酿酒葡萄与葡萄酒 萄与葡萄酒样品的理化指标数据,下面以红葡萄酒主成分分 的各理化指标之间的联系. 析输出结果摘要为例进行分析. 1 分析的数据和方法 表1相关矩阵表 Kaiser—Meyer—Olkin Measure of Sampling Adequacy. .684 1.1分析的数据 某一年份葡萄酒样品和酿酒葡萄样品的理化指标数据, 其中包括27个酿酒红葡萄及葡萄酒样品,28个酿酒白葡萄 及葡萄酒样品. 表2完全变量解释 收稿日期:2012一o9一l5 作者简介:何少芳(1980一),女,湖南嘉禾人,湖南农业大学理学院讲师,硕士.研究方向:高等数学 12 长沙大学学报 2012年9月 表3旋转后的因子(主成分)负荷矩阵 表l显示系统输出的相关系数矩阵,经Ba ̄lett检验表 明:Bartlett值=431.157,P<0.0001,即相关矩阵不是一个单 位矩阵,故考虑进行因子分析,KMO值=0.684,意味着因子 分析结果能够接受.表2显示,使用主成分分析法得到三个 因子(主成分),累计贡献率为87.294%,具有统计学上的意 义.在旋转后的因子负荷矩阵中,变量与某个因子的联系系 数的绝对值越大,则该因子与变量的关系越近.表3显示本 例红葡萄酒的理化指标变量总酚与第一因子的值为0.970, 与第二、第三因子的值分别为一0.138、0.080,可见其与第一 因子更近,与第二、三因子较远,应该将其放在第一主成分 中.在系统进行主成分分析的过程中,已将各因子(主成分) 的因子综合得分分别用变量名(如Rw1)存入原始数据库 中,这些值将用于对两组变量的典型相关分析. 酿酒红(白)葡萄和红(白)葡萄酒理化指标的主成分分 析结果见如表4—7. 表4红葡萄酒的理化指标主成分分析结果 第109期 2.2典型相关分析 何少芳,李梦祝:SPSS软件在葡萄与葡萄酒理化指标的相关性分析中的应用 13 在统计分析软件SPSS10.0中分别输入酿酒红(白)葡萄 与红(白)葡萄酒理化指标主成分因子综合得分数据,执行 命令 include‘C:\Program Files\SPSS\Canonical correlation.sps’. CANCORR SETI=R1 R2 R3 R4 R5 R6 R7 R8 R9 RIO/ 物质)与白葡萄酒的第一个主成分WWI(色泽L、色泽a、色 泽b、色泽H、色泽C)、酿酒白葡萄的第九个主成分W9(氨基 酸、苹果酸)与白葡萄酒的第三个主成分WW3(白藜芦醇)、 酿酒白葡萄的第五个主成分W5(总糖、果糖、出汁率)与白 葡萄酒的第一个主成分ww1(色泽L、色泽a、色泽b、色泽 H、色泽C)也有较高的相关性,其他主成分之间的相关性 较弱. SET2=RW1 RW2 RW3/.(红) include‘C:\Program Files\SPSS\Canonical correlation.sps’. CANCORR SET1=Wl W2 W3 W4 W5 W6 W7 W8 W9 表l0酿酒红葡萄和红葡萄酒的典型变量相关系数 W10 Wl1/ l 2 3 952 880 723 SET2=WW1 WW2 WW3/.(白) 得到主要输出结果见表8—13,下面对输出结果进行 分析. 表8是酿酒红葡萄和红葡萄酒主成分两组变量的各变 量间的两两相关矩阵,从表中呵看出酿酒红葡萄的第一个主 成分Rl(花色苷、自由基、总酚、单宁、葡萄总黄、顺芦醇)与 红葡萄酒的第一个主成分RW1(色花苷,单宁,总酚,酒总黄 酮,白藜芦醇,半抑制体、色泽L)具有较很高的相关性,酿酒 红葡萄的第三个主成分R3(还原糖、果糖、葡萄糖)与红葡萄 酒的第三个主成分RW3(色泽b,色泽H)也具有较高的相关 性,其他主成分之间的相关性较弱. 表8红葡萄和红葡萄酒关系矩阵 表1 1 酿酒红葡萄和红葡萄酒的显著性检验 表9是酿酒白葡萄和白葡萄酒主成分两组变量问各变 量之间的两两相关矩阵,观察表中变量间的相关系数可知, 酿酒白葡萄的第二个主成分W2(自由基、总酚、 宁、葡萄总 黄、黄酮醇、异鼠李素)与白葡萄酒的第二个主成分WW2(单 宁、总酚酒、总黄酮、半抑制体)具有很高的相关性,酿酒自葡 萄的第一个主成分W1(VC、还原糖、果糖、葡萄糖、可溶、干 『_f{表10、11可知,在酿酒红葡萄和红葡萄酒的典型变量 相关系数中,第一、第二和第三典型相关系数分别为0.952、 0.880和0.723,说明第一维度相关属于强相关;显著性检验 的结果也表明,在0.05的显著性水平下,第一典型变量的相 关性非常显著. 14 长沙大学学报 2012年9月 表14红葡萄酒的典型负载系数 变量组各典型变量对于因变量组所有观测变量的解释能 力 .由图1可知,酿酒红葡萄的主成分变量被自身的三个 典型变量均揭示了10%,红葡萄酒的主成分变量被自身的三 个典型变量均揭示了33.3%;酿酒红葡萄的主成分变量被红 葡萄酒第一典型变量解释了9.1%,被第二典型变量解释了 7.7%,被第三典型变量解释了5.2%,红葡萄酒的主成分变 量被酿酒红葡萄的第一典型变量解释了30.2%,被第二典型 变量解释了25.8%,被第三典型变量解释了17.4%. 综合以上分析可以得出。由酿酒红葡萄和红葡萄酒主成 分变量组成的典型变量之间相关性很高,其中,酿酒红葡萄 的第一个主成分R1在本组的第一典型变量上发挥了解释作 用,红葡萄酒的第一个主成分RWl在本组的第一个典型变 量上发挥了解释作用,而显著性检验的结果表明,第一典型 变量的相关性非常显著,因此R1与RWI之间有很强的相关 关系,即酿酒红葡萄理化指标中的花色苷、自由基、总酚、单 宁、葡萄总黄、顺芦醇与红葡萄酒理化指标中的色花苷、单 Proportion of Variance of Set一1 Explained by Its Own Can.Vat. 宁、总酚、酒总黄酮、白藜芦醇、半抑制体、色泽L有很强的相 Prop Var 关关系. CVI—1 .100 同理可以分析出由酿酒白葡萄和白葡萄酒主成分变量 CV1—2 .10o 组成的典型变量之间相关性较高,其中,酿酒白葡萄的第一 CV1—3 .1oo 个主成分W1、W5在本组的第一典型变量上发挥了解释作 Proportion ofVariance of Set~2 Explained byIts Own Can.Vat. 用,第一主成分W2、第九主成分W9在本组的第二典型变量 Prop Var 上发挥了解释作用,白葡萄酒的第一个主成分ww1在本组 CV2一1 .333 的第一个典型变量上发挥了解释作用,白葡萄酒的第二个主 CV2—2 .333 成分WW2在本组的第二个典型变量上发挥了解释作用,显 CV2—3 .333 著性检验的结果表明,第一典型变量的相关性非常显著,第 二典型变量的相关性显著,因此W1、W5与WW1之间有很 Proportion of Variance of Set—l Explained by Opposite Can.Vat. 强的相关关系,W2、W9与WW2之间有较强相关关系,即酿 Prop Var 酒白葡萄理化指标中的VC、还原糖、果糖、葡萄糖、可溶、干 CV2一1 .091 物质、总糖、果糖、出汁率与白葡萄酒理化指标中的色泽L、 CV2—2 .077 色泽a、色泽b、色泽H、色泽C有很强的相关关系,自由基、 CV2—3 .052 总酚、单宁、葡萄总黄、黄酮醇、异鼠李素、氨基酸、苹果酸与 Proportion of Variance of Set-2 Expiain ̄d by Opposite Can.Var. 单宁、总酚、酒总黄酮、半抑制体有较强相关关系. Prop Var 3小结 CVl一1 .302 CVl一2 .258 本文利用SPSS软件对某一年份葡萄酒样品和酿酒葡萄 CVl一3 .174 样品的理化指标数据(包括27个酿酒红葡萄及葡萄酒样品, 28个酿酒白葡萄及葡萄酒样品)进行主成分分析及典型相 图1 酿酒红葡萄和红葡萄酒的冗余分析图 关分析,得出酿酒葡萄与葡萄酒的理化指标之间的联系:酿 酒红葡萄理化指标中的花色苷、自由基、总酚、单宁、葡萄总 典型负载系数是典型变量与本组观测变量之间的两两 黄、顺芦醇与红葡萄酒理化指标中的色花苷、单宁、总酚、酒 简单相关系数,可以从一定程度上反映典型变量与同属本组 总黄酮、白藜芦醇、半抑制体、色泽L (D65)有很强的相关 的观测变量进行简单回归时测量散点与回归线之间拟合程 关系;酿酒白葡萄理化指标中的VC、还原糖、果糖、葡萄糖、 度 J,从表12—15可以看出,酿酒红葡萄的第一个主成分 可溶、干物质、总糖、果糖、出汁率与白葡萄酒理化指标中的 R1与本组的第一个典型变量呈很强的负相关性,且Rl与红 色泽L (1)65)、色泽a (D65)、色泽b¥(D65)、色泽H 葡萄酒的第一个典型变量呈很强的负相关性;红葡萄酒的第 (D65)、色泽C(I)65)有很强的相关关系;自由基、总酚、单 一个主成分RW1与本组的第一个典型变量呈很强的负相关 宁、葡萄总黄、黄酮醇、异鼠李素、氨基酸、苹果酸与单宁、总 性,且RW1与酿酒红葡萄的第一个典型变量呈很强的负相 酚、酒总黄酮、半抑制体有较强相关关系. 关性.由两组变量的第一典型变量之间的强相关性可知,R1 与RW1之间有很强的相关性. 参考文献: 冗余分析包括组内代表比例和交叉解释比例,是典型相 [1]李运,李记明,姜忠军.统计分析在葡萄酒质量评价中的应用 关分析中很重要的部分.组内代表比例指本组所有观测变量 [J].2009,(4):79—83. 的总标准方差中由本组形成的各个典型变量所分别代表的 [2]黄润龙.数据统计分析——sPss原理及应用[M].北京:高等教 比例;交叉解释比例是指一组当中形成的典型变量对另一组 育出版社,2010. 观测变量的解释比例,是一种组间交叉共享比例,反映了自 [3]高惠璇.应用多元统计分析[M].北京:北京大学出版社,2005. (责任编校:睛川) 

因篇幅问题不能全部显示,请点此查看更多更全内容

Top