您好,欢迎来到飒榕旅游知识分享网。
搜索
您的当前位置:首页最新《SPSS统计软件应用》实验报告册

最新《SPSS统计软件应用》实验报告册

来源:飒榕旅游知识分享网


《SPSS统计软件应用》

实验报告册

20 15 - 20 16 学年 第 1 学期 班 级: T1353-3 学 号: 20130530305 姓 名: 徐 云 授课教师: 薛昌春 实验教师:薛昌春 实验学时: 一周 实验组号:

目 录

1. 实验一 SPSS的数据管理 2. 实验二 描述性统计分析 3. 实验三 4. 实验四 5. 实验五 6. 实验六 7. 实验七 8. 实验八 均值检验 相关分析 因子分析 聚类分析 回归分析 判别分析

实验一 SPSS的数据管理

一、 实验目的

1.熟悉SPSS的菜单和窗口界面,熟悉SPSS各种参数的设置; 2.掌握SPSS的数据管理功能。 二、 实验内容:

1、定义spss数据结构。下表是某大学的一个问卷调查,要求将问卷调查结果表示成spss可识别的数据文件,利用spss软件进行分析和处理。 练习:创建数据文件的结构,即数据文件的变量和定义变量的属性。 实验步骤:

(1) 打开SPSS 软件,新建一张date数据表;

(2) 打开 variable view 界面,对相应的变量数据进行属性设置; (3) 打开 date view界面,输入数据,点击保存; 实验结果及分析:略

2 、高校提前录取名单的确定

某高校今年对部分考生采取单独出题、提前录取的招生模式。现有20名来自国内不同省市的考生报考该校,7个录取名额。见数据文件compute.sav. 该校制定了如下录取原则:(1)文化课成绩由数学、语文、英语和综合四门成绩组成。文化课成绩制定最低录取分数线:400分。

(2)个人档案中若有“不良记录”,不予录取。

(3)对西部考生和少数民族考生,给予加分优惠。少数民族考生加20分,西部考生加10分。

(4)对参加过省以上竞赛并取得三等奖以上名次的考生,每项加10分。 (5)文化课成绩和加分总和构成综合分,录取综合排名为前7名的学生。 练习:利用spss软件,综合利用所学 ,给出成绩排名的操作步骤。 实验步骤:

(1) 打开给的原数据文件;

(2) 执行 date/select case 命令,打开select case对话框,选择 if

condiction is satisfatied ,输入“(数学 + 语文 + 英语 + 综合) >= 400 and 不良记录 = 0”,点击continue。并在output选项中选择“copy select case to a new dataset”,确认。

(3) 同样的方法确定有省份、民族和所获奖项得到的加分条件,结果如图:

(4) 执行 transform /compute 命令,在numermic expression 中输入“(数

学 + 语文 + 英语 + 综合 + * 10 + * 20 + * 10) * 录取资格权数”,在taget variable 中输入“最终成绩”,确认。 (5) 执行 date/sort case 操作,对最终成绩进行降序排列。 实验结果及分析: 结果如图所示:

对前七个进行录取即可。

实验二 描述性统计分析

一、

实验目的

利用SPSS进行描述性统计分析。要求掌握频数分析(Frequencies过程)、描述性分析(Descriptives过程)、交叉列联表分析(Crosstabs过程)。

二、 实验内容:

1、打开数据文件descriptives.sav,是从某校选取的3个班级共16名学生的体检列表,要求以班级为单位列表计算年龄,体重和身高的统计量,包括极差,最小最大值,均值,标准差和方差。给出操作步骤和分析结果。 实验步骤:

(1) 在SPSS中打开已经存在的文件descriptives.sav。

(2) 执行 analyze/ descriptive statistics /descriptives,在

variable中选入年龄、身高、体重。

(3) 点击options ,进入potions选项栏,选入需要的统计量,单击

continue,确认。

实验结果及分析:实验结果如图: Descriptive Statistics N Range Minimum Maximum Mean Std. Statistic Statistic Statistic Statistic Statistic 年龄 体重 身高 Valid N (listwise) 16 16 16 16 5 32.00 31.00 13 38.00 149.00 18 16.06 Error .382 Std. Deviation Variance Skewness Std. Kurtosis Std. Statistic Statistic Statistic Error Statistic Error 1.526 2.329 -.505 .5 -.308 .5 .135 .5 -.9 1.091 -.7 1.091 -.633 1.091 70.00 55.6250 2.36973 9.472 .850 180.00 1.6369E2 2.259 9.03857 81.696 在表中,最大值,最小值与均值方差一目了然。

2、某医生用国产呋喃硝胺治疗十二指肠溃疡,以甲氰咪胍作对照组,问两种方法治疗效果有无差别 处 理 呋喃硝胺 甲氰咪胍 合 计 愈 合 44 98 未愈合 8 20 28 合计 62 126 (提示:由于此处给出的直接是频数表,因此在建立数据集时可以直接输入三个变量――行变量、列变量和指示每个格子中频数的变量,然后用Weight Cases对话框指定频数变量,最后调用Crosstabs过程进行X2检验。假设三个变量分别名为R、C和W,则数据集结构和命令如下):

R 1.00 1.00 2.00 2.00

C 1.00 2.00 1.00 2.00

W .00 44.00 8.00 20.00

实验步骤:

(1) 先通过excel将题目中的数据导入到SPSS中,如图:

(2) 执行 analyze/descriptives statistics /crosstabs 命令,在中导入药

名,在column中导入愈合,其他设置采用默认设置,确认。 实验结果及分析:结果如图所示:

表一表示参与分析的数据有98个,无缺失值;表二表明了药名与治愈之间的交叉关系。

实验三 均值检验

一、实验目的

学习利用SPSS进行单样本、两样本以及成对样本的均值检验。 二、实验内容:

1、一个生产高性能汽车的公司生产直径为322mm的圆盘制动闸。公司的质量控制部门随机抽取不同机器生产的制动闸进行检验。共4台机器,每台机器抽取16支产品。见数据文件ttest1.sav,要求检验每个机器生产的产品均值和322在90%的置信水平下是否有显著差异。 实验步骤:

(1) 在SPSS中打开数据ttest1.sav

(2) 执行 analyze/compara means /one-sample test操作;

(3) 在弹出来的选选项框中,在test variable中选入制动闸直径,test

values中输入322 ,确认。

实验结果及分析:

结果如图,样本量是,均值为322,标准差为0.0122577,标准误差是0.0015322.、相伴概率为0.295,所以不拒绝原假设,认为每个机器生产的产品的直径无显著性差异。

2、在体育课上记录14名学生乒乓球得分的数据,男女各7名。数据如下: 男:82.00 80.00 85.00 85.00 78.00 87.00 82.00 女:75.00 76.00 80.00 77.00 80.00 77.00 73.00 比较在置信度为95%的情况下男女生得分是否有显著差别。 实验步骤:

(1)将数据录入到SPSS中,如图:

(2)执行analyze/compara means /dependent-sample test操作,在弹出来的对话框中,在test variable中选入成绩 ,在group variable中选入组别,点击define group 分别输入0和1,continue,确认。

实验结果及分析: 结果如图,男女成绩均值分别为82.71和77.50,标准差分别为3.147和2.074,伴随概率为0.005,小于0.05,说明男女的分有显著性差别。

Group Statistics 成绩 组别 1 2 N Mean 7 82.71 6 77.50 Std. Deviation Std. Error Mean 3.147 2.074 1.190 .847 Independent Samples Test Levene's Test for Equality of Variances t-test for Equality of Means 95% Confidence Interval of the Sig. Mean Std. Error Difference Lower Upper 成Equal 绩 variances assumed Equal variances not assumed F Sig. t df (2-tailed) Difference Difference 1.365 .267 3.455 11 .005 5.214 1.509 1.3 8.536 3.571 10.412 .005 5.214 1.460 1.979 8.450

3、某医疗结构针对具有家族心脏病史的病人研发了一种新药。为了检验这种新药的疗效是否显著,对16位病人进行为期半年的观察测试,测试指标为使用该药之前和之后的体重以及甘油三酯的水平的变化。见数据文件ptest.sav.

实验步骤:

(1) 打开文件ptest.sav;

(2) 执行analyze/compara means /paireds-sample test操作; (3) 分别在弹出来的对话框中输入tg0 和tg1及wgt0和wgt1.确认 实验结果及分析: 结果如图:表1给出了两对配对数据的各自均值,参与数量,标准差和标准误差。

表2给出了两对配对数据的相关系数,从表3中可以得出,服用新药前后甘油三酯的

伴随概率为0.283,大于0.05,所以甘油三酯在服药前后有显著性差异,而体重在服药前后的伴随概率小于0.05,不能说明服药前后对体重有显著性影响。

Paired Samples Statistics Pair 1 服药前甘油三酯水平 服药后甘油三酯水平 Mean 138.44 124.38 198.38 190.31 N 16 16 16 16 Std. Deviation 29.040 29.412 33.472 33.508 Std. Error Mean 7.260 7.353 8.368 8.377 Pair 2 服药前体重 服药后体重 表1 Paired Samples Correlations Pair 1 服药前甘油三酯水平 & 服药后甘油三酯水平 N 16 16 Correlation -.286 .996 Sig. .283 .000 Pair 2 服药前体重 & 服药后体重 表2 Paired Samples Test 1 Std. Paired Differences 95% Confidence Interval Std. Error Mean of the Difference Lower Upper t Sig. df (2-tailed) 平 - 服药后甘油三酯水平 Mean Deviation Pair 服药前甘油三酯水14.062 46.875 11.719 -10.915 39.040 1.200 15 .249 Pair 服药前体重 - 服2 药后体重 8.062 2.886 .722 6.525 9.600 11.175 15 .000 表3

实验四 相关分析

一、 实验目的

学习利用SPSS进行相关分析、偏相关分析、距离分析。

二、实验内容: 1、打开数据文件correlate1.sav, 要求分析汽车价格和汽车的燃油效率之间是否存在线性关系。 实验步骤:

(1) 在spss中打开已经录好的文件correlate1.sav ;

(2) 执行analyze/correlate/bivariate 命令;在弹出的bivariate

correlation对话框中,将price和mpg添加到variable列表框中如图所示:

(3) 单击option选项,选中 means and devilation,单击continue,

确认,

实验结果及分析:如图

从图中可以看出汽车汽车价格与汽车的燃油效率之间的的相关系数为-0.492,判定系数为0.01,小于0.05.说明价格与燃油效率之间无显著相关关系。

2、打开数据文件pcorrelation.sav,对身高、体重和肺活量进行变量距离分析。选相似性测度。进行结果解释。 实验步骤:

(1)在SPSS中打开文件pcorrelation.sav ; (2)执行analyze/correlate /distances 操作。 (3)在variable中录入身高、体重和肺活量;

(4)选择between variable单选按钮和similiarities选项,确认。 实验结果及分析:

结果如图所示:可知所有的变量都参与了分析,而且身高和体重相似性最大。

3、打开数据文件distance.sav, 文件是利用三种不同的仪器对飞机的10只叶片的半径分别进行了测量。要求对10只叶片进行距离分析。用Euclidean distance。进行结果解释。 实验步骤:

(1) 打开文件distance.sav

(2) 执行操作analyze/correlate /distances ;

(3) 选择between case 和dissimiliarities ,确认。

实验结果及分析:结果如图:可以看出10个case都参加了分析,分析得出不相似性最大的10和7 其次有很大的不相似性的还有1和7、1和8、1和10、2和7、6和10、8和10等等。 Case Processing Summary Cases Valid N 10 Percent 100.0% N 0 Missing Percent .0% N 10 Total Percent 100.0% Proximity Matrix 1 2 3 4 5 6 7 8 9 10 1 .000 .663 .490 .469 .795 .800 .962 .930 .378 .935 2 .663 .000 .445 .522 .198 .870 .991 .708 .373 .465 3 .490 .445 .000 .312 .475 .560 .714 .580 .330 .838 4 .469 .522 .312 .000 .634 .415 .559 .465 .219 .963 Euclidean Distance 5 .795 .198 .475 .634 .000 .922 1.036 .734 .528 .468 6 .800 .870 .560 .415 .922 .000 .170 .375 .633 1.329 7 .962 .991 .714 .559 1.036 .170 .000 .382 .775 1.4 8 .930 .708 .580 .465 .734 .375 .382 .000 .621 1.162 9 .378 .373 .330 .219 .528 .633 .775 .621 .000 .776 This is a dissimilarity matrix

实验五:因子分析

一、实验目的:运用因子分析方法分析数据 二、实验内容:

下表资料为25名健康人的7项生化检验结果,7项生化检验指标依次命名为X1至X7,请对该资料进行因子分析。 X1 3.76 8.59 6.22 7.57 9.03 5.51 3.27 8.74 9. 9.73 8.59 7.12 4.69 5.51 1.66 5.90 9.84 8.39 4.94 7.23 9.46 9.55 4.94 8.21 9.41 X2 3.66 4.99 6.14 7.28 7.08 3.98 0.62 7.00 9.49 1.33 2.98 5.49 3.01 1.34 1.61 5.76 9.27 4.92 4.38 2.30 7.31 5.35 4.52 3.08 6.44 X3 0. 1.34 4.52 7.07 2.59 1.30 0.44 3.31 1.03 1.00 1.17 3.68 2.17 1.27 1.57 1.55 1.51 2. 1.03 1.77 1.04 4.25 4.50 2.42 5.11 X4 5.28 10.02 9.84 12.66 11.76 6.92 3.36 11.68 13.57 9.87 9.17 9.72 5.98 5.81 2.80 8.84 13.60 10.05 6.68 7.79 12.00 11.74 8.07 9.10 12.50 X5 9.77 7.50 2.17 1.79 4. 5.33 7.63 3.53 13.13 9.87 7.85 2. 2.76 4.57 1.78 5.40 9.02 3.96 6.49 4.39 11.58 2.77 1.79 3.75 2.45 X6 13.74 10.16 2.73 2.10 6.22 7.30 8.84 4.76 18.52 11.06 9.91 3.43 3.55 5.38 2.09 7.50 12.67 5.24 9.06 5.37 16.18 3.51 2.10 4.66 3.10 X7 4.78 2.13 1.09 0.82 1.28 2.40 8.39 1.12 2.35 3.70 2.62 1.19 2.01 3.43 3.72 1.97 1.75 1.43 2.81 2.27 2.42 1.05 1.29 1.72 0.91 实验步骤: (1) 将上述数据导入到spss 中,如图:

(2) 执行analyze /date reduction /factor 命令,得到如图所示的对话

框:

(3) 分别在图中右边的选项中进行设置,最后确认,得到结果如图:

实验结果及分析:

在上面的图中,具有影响的七个变量被整合成具有影响力的factor1和factor2两个因素,具体分析如下: (1)

从表中数据可以看出七个变量之间的相关性和相关系数,构成了一个7*7的交叉分析,有好多的因子之间的相关系数大于0,3,判定系数大于0.05,具有显著地相关性。 (2)

这是因子分析的初始结果。

(3) 是因子分析后因子提取和因子旋转的结果: Total Variance Explained Initial Eigenvalues Extraction Sums of Squared Loadings Rotation Sums of Squared Loadings % of % of % of Component Total Variance Cumulative % Total Variance Cumulative % Total Variance Cumulative % 1 2 3 4 5 6 7 3.395 48.503 2.806 40.090 .436 .276 .081 .004 .000 6.236 3.946 1.160 .059 .006 48.503 3.395 88.593 2.806 94.828 98.775 99.935 99.994 100.000 48.503 40.090 48.503 88.593 3.306 47.231 2.5 41.361 47.231 88.593 Extraction Method: Principal Component Analysis. 第一列是因子序号,第二列是因子对方差的贡献值,第三列是因子对方差的贡献率,第四列是因子的累积贡献率,从第五列到第七咧是从初始解中按一定的标准提取三个公共因子后对原变量总体的描述情况。从第八列到第十列是旋转后得到的因子对原变量整体的贡献情况; (4)表示公共因子碎石图

纵轴表示影响水平,横轴表示因子编号。从图中可以看住前三个因子的影响因素最大,后面的四个因子的影响几乎可以忽略不计。

实验六:聚类分析

一、实验目的:运用聚类分析方法分析数据 二、实验内容:

29名儿童的血红蛋白(g/100ml)与微量元素(μg/100ml)测定结果如下表。由于微量元素的测定成本高、耗时长,故希望通过聚类分析(即R型指标聚

类)筛选代表性指标,以便更经济快捷地评价儿童的营养状态。

编号 钙 镁 铁 锰 铜 血红蛋白 N0. X1 X2 X3 X4 X5 X6 1 . 30.86 448.70 0.012 1.010 13.50 2 72.49 42.61 467.30 0.008 1.0 13.00 3 53.81 52.86 425.61 0.004 1.220 13.75 4 .74 39.18 469.80 0.005 1.220 14.00 5 58.80 37.67 456.55 0.012 1.010 14.25 6 43.67 26.18 395.78 0.001 0.594 12.75 7 . 30.86 448.70 0.012 1.010 12.50 8 86.12 43.79 440.13 0.017 1.770 12.25 9 60.35 38.20 394.40 0.001 1.140 12.00 10 .04 34.23 405.60 0.008 1.300 11.75 11 61.23 37.35 446.00 0.022 1.380 11.50 12 60.17 33.67 383.20 0.001 0.914 11.25 13 69.69 40.01 416.70 0.012 1.350 11.00 14 72.28 40.12 430.80 0.000 1.200 10.75 15 55.13 33.02 445.80 0.012 0.918 10.50 16 70.08 36.81 409.80 0.012 1.190 10.25 17 63.05 35.07 384.10 0.000 0.853 10.00 18 48.75 30.53 342.90 0.018 0.924 9.75 19 52.28 27.14 326.29 0.004 0.817 9.50 20 52.21 36.18 388. 0.024 1.020 9.25 21 49.71 25.43 331.10 0.012 0.7 9.00 22 61.02 29.27 258.94 0.016 1.190 8.75 23 53.68 28.79 292.80 0.048 1.320 8.50 24 50.22 29.17 292.60 0.006 1.040 8.25 25 65.34 29.99 312.80 0.006 1.030 8.00 26 56.39 29.29 283.00 0.016 1.350 7.80 27 66.12 31.93 344.20 0.000 0.6 7.50 28 73. 32.94 312.50 0.0 1.150 7.25 29 47.31 28.55 294.70 0.005 0.838 7.00

实验步骤:

(1) 将题目中的 数据录入到SPSS中,如图:

(2) 执行 analyze/classfily /hierarchical cluster 命令,将钙、鎂、

铁猛、铜和蛋白质录入到variable列表框中,将编号录入到 label case by 中,在cluster选项栏中选择variable,表示是R型类聚; (3) 点击右边的statistics,选择single solution ,且在后面输入2 ,

表示显示将样本分成二类 ;

(4) 点击plot按钮,复选dendrogram ,并在icicle 复选框中选all

cluster ;

(5) 点击method,选择pearson correlation ,为R型类聚专业方法,确

认。

实验结果及分析: 结果分好几部分:

(1)从表中可以看出有29个样本参与了类聚分析,其中因有缺省值而忽略的样本有2个。 Case Processing Summarya Cases Valid N Percent 29 93.5% Missing N Percent 2 6.5% N Total Percent 31 100.0% a. Correlation between Vectors of Values used (2) 从表格中得到第三变量与第六变量先进行了类聚,相关为0.863,接着是第一和第五参与类聚,相关为0.625,一直这样下去。 Cluster Combined Stage Cluster First Appears Next Stage 3 4 4 5 0 Cluster Cluster CoefficienStage 1 2 ts Cluster 1 Cluster 2 1 2 3 4 5 3 1 2 1 1 6 5 3 2 4 .863 .625 .602 .338 -.0 0 0 0 2 4 0 0 1 3 0 (3) 在变量类聚到二个变量时,从下表中可以看出鎂、钙、铜、血红蛋白和铁是一类,猛是另一类 ;

Cluster Membership Case

2 Clusters 钙 镁 铁 锰 铜 血红蛋白 1 1 1 2 1 1 (4) 下图是冰柱图,可以看出是铁与血红蛋白先类聚,然后是铜与钙。

Vertical Icicle Case Number of clusters 锰 血红蛋白 铁 镁 铜 钙 1 2 3 4 5 X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X (6) 下图是层次分析的树状图,从图中可以看出整体的类聚情况:

C A S E 0 5 10 15 20 25

Label Num +---------+---------+---------+---------+---------+

铁 3 ─┬─────────────┐ 血红蛋

白 6 ─┘ ├─────────────┐

镁 2 ───────────────┘ ├───────────────────┐ 钙 1 ─────────────┬───────────────┘ │ 铜 5 ─────────────┘ │ 锰 4 ─────────────────────────────────────────────────┘

实验七:回归分析

一、实验目的:运用一元线性回归与多元线性回归进行预测 二、实验内容:

2

某医师测得10名3岁儿童的身高(cm)、体重(kg)和体表面积(cm)资料如下。试用多元回归方法确定以身高、体重为自变量,体表面积为应变量的回归方程。 儿童编号 1 2 3 4 5 6 7 8 9 10 体表面积(Y) 身高(X1) 5.382 5.299 5.358 5.292 5.602 6.014 5.830 6.102 6.075 6.411 88.0 87.6 88.5 .0 87.7 .5 88.8 90.4 90.6 91.2 体重(X2) 11.0 11.8 12.0 12.3 13.1 13.7 14.4 14.9 15.2 16.0 实验步骤: (1) 把上述数据导入到SPSS软件中;

(2) 执行 analyze /regression /linear 操作,打开linear regression

对话框;

(3) 在dependent中选入儿童编号 ,在independent中选入体表面积、身

高和体重;

(4) 在该对话框中单击statistics按钮,打开statistics对话框,选择

estimates 、model fit 、descriptives 选项 ,单击continue ,确认。

实验结果及分析: 分析共计六个结果:

(1) 表一表述的是个变量的均值、标准差和参与回归的变量个数:

Descriptive Statistics Mean 儿童编号 身高(X1) 体重(X2)

(2) 表二表示的是各变量之间的相关性,可以看出体重与儿童编号相关性

最大; Correlations Pearson Correlation 儿童编号 体表面积(Y) 身高(X1) 体重(X2) Sig. (1-tailed) 儿童编号 体表面积(Y) 身高(X1) 体重(X2) N 儿童编号 体表面积(Y) 身高(X1) 体重(X2)

(3) 表三表示在多元回归分析中,被引入或被踢出的各个变量,参与回归

的有体重、身高和体表面积,没有变量被踢出; Variables Entered/Removedb Variables Model Entered Variables Removed Method 儿童编号 体表面积(Y) 身高(X1) 体重(X2) 1.000 .930 .878 .995 . .000 .000 .000 10 10 10 10 .930 1.000 .869 .943 .000 . .001 .000 10 10 10 10 .878 .869 1.000 .863 .000 .001 . .001 10 10 10 10 .995 .943 .863 1.000 .000 .000 .001 . 10 10 10 10 5.50 .13 13.44 体表面积(Y) 5.73650 Std. Deviation 3.028 .403441 1.2 1.663 N 10 10 10 10 1 体重(X2), 身高(X1), 体表面积(Y)a . Enter a. All requested variables entered. b. Dependent Variable: 儿童编 号

(4) 表四是输出的常用统计量,可知相关系数R=0.997,判定系数R2=0.990,

回归估计的标准误差是0.303;

Model Summary Std. Error Adjusted R of the R Square Square Estimate .993 .990 .303 Model 1 R .997a a. Predictors: (Constant), 体重(X2), 身高(X1), 体表面积(Y) (5) 表五是一个方差分析表,统计量F =297.165,相伴概率P <0.001,表

示有显著地相关关系;

ANOVAb Model 1 Regression Residual Total Sum of Squares 81.948 .552 82.500 df Mean Square 3 6 9 F Sig. .000a 27.316 297.165 .092 a. Predictors: (Constant), 体重(X2), 身高(X1), 体表面 积(Y) b. Dependent Variable: 儿童编 号 (6) 表六是回归系数分析B是非标准化系数,bate是标准系数,std.err

是标准误差,t是回归系数检验统计量,sig是伴随概率。

Standardized Coefficients Beta t -2.832 -.135 -1.270 .106 1.031 1.523 9.885 Sig. .030 .251 .179 .000 Unstandardized Coefficients Model 1 (Constant) 体表面积(Y) 身高(X1) 体重(X2) B -36.615 -1.016 .255 1.876 Std. Error 12.931 .799 .167 .190 a. Dependent Variable: 儿童编 号

实验八:判别分析

一、实验目的:运用判别分析进行分类预测 二、实验内容:

为研究舒张期血压和血浆胆固醇对冠心病的作用,某医师测定了50-59岁冠心病人15例和正常人16例的舒张压和胆固醇指标,结果如下,试作判别分析,建立判别函数以便在临床中用于筛选冠心病人。

编号 冠心病人组 编号 正常人组

舒张压胆固醇mmol/L 舒张压胆固醇mmol/L kPa x2 kPa x2 x1 x1 1

2 3 4 5 6 7 8 9 10 11 12 13

9.86 13.33 14.66 9.33 12.80 10.66 10.66 13.33 13.33 13.33 12.00 14.66 13.33

5.18 3.73 3. 7.10 5.49 4.09 4.45 3.63 5.96 5.70 6.19 4.01 4.01

1 2 3 4 5 6 7 8 9 10 11 12 13

10.66 12.53 13.33 9.33 10.66 10.66 9.33 10.66 10.66 10.66 10.40 9.33 10.66

2.07 4.45 3.06 3.94 4.45 4.92 3.68 2.77 3.21 5.02 3.94 4.92 2.69

14 15 12.80 13.33 3.63 5.96

14 15 16 10.66 11.20 9.33 2.43 3.42 3.63

实验步骤:

(1) 将数据导入到SPSS中,如图:

(2) 执行analyze /classify /discriminant 操作;

(3) 在打开的对话框中将舒张压与胆固醇含量输入到independents列表

中,再讲组别输入到group variable中;

(4) 打开define range 中输入范围1到2,单击continue,确认。

实验结果及分析:

结果共有14个:

(1) 图1表示所有的数据都参与了分析;

(2) 图2 表示组别的统计信息,表中显示共有2组,第一组15例,第二

组16例;

(3) 图3表示以组别为自变量,以舒张压和胆固醇含量为因变量在两个组

别中的平均差异值,其中F值越大,平均数的差异越大,Wilks’lambda的值越小。

(4) 图4 表示组内2个变量的相关性和方差矩阵。

Analysis Case Processing Summary Unweighted Cases Valid Excluded Missing or out-of-range group codes At least one missing discriminating variable Both missing or out-of-range group codes and at least one missing discriminating variable Total Total N Percent 31 100.0 0 0 0 0 .0 .0 .0 .0 31 100.0 图1

Group Statistics Valid N (listwise) 组别 1 舒张压kPa 胆固醇mmol/L 2 舒张压kPa 胆固醇mmol/L Total 舒张压kPa 胆固醇mmol/L Mean Std. Deviation 12.4940 4.8680 10.6287 3.6625 11.5313 4.2458 1.0 1.12948 1.09681 .92467 1.65996 1.18231 Unweighted 15 15 16 16 31 31 Weighted 15.000 15.000 16.000 16.000 31.000 31.000 图2 Group Statistics Valid N (listwise) 组别 1 舒张压kPa Mean Std. Deviation Unweighted Weighted 12.4940 1.0 1.12948 1.09681 .92467 1.65996 1.18231 15 15 16 16 31 31 15.000 15.000 16.000 16.000 31.000 31.000 胆固醇mmol/L 4.8680 2 舒张压kPa 10.6287 胆固醇mmol/L 3.6625 Total 舒张压kPa 11.5313 胆固醇mmol/L 4.2458 图3

Pooled Within-Groups Matrices a Covariance 舒张压kPa 胆固醇mmol/L 舒张压kPa 1.922 -.450 1.000 -.316 胆固醇mmol/L -.450 1.058 -.316 1.000 Correlation 舒张压kPa 胆固醇mmol/L a. The covariance matrix has 29 degrees of freedom. 图4

(5)图5是系统生成的第五张表 Covariance Matrices 组别 1 舒张压kPa 胆固醇mmol/L 2 舒张压kPa 胆固醇mmol/L Total 舒张压kPa 胆固醇mmol/L 舒张压kPa 2.692 -.7 1.203 -.157 2.755 .145 胆固醇mmol/L -.7 1.276 -.157 .855 .145 1.398 aa. The total covariance matrix has 30 degrees of freedom. 图5

(6) 两个表合在一起看,表示组共变异数的假设检验,其中Box’s M 的值为2.815,F值为0.278,相伴概率为0.457,达到了显著性水平,因此2组样本的共变异数不相等,这是不符合判别分析的假设的。 Log Determinants Log Determinan组别 1 2 Pooled within-groups Rank 2 2 2 t 1.048 .004 .605 The ranks and natural logarithms of determinants printed are those of the group covariance matrices. 图6.1

Test Results Box's M F Approx. df1 df2 Sig. 2.815 .868 3 1.780E5 .457 图6.2

(7) 图7是前两项判别函数的特征值,占总方差的百分数、累加百分比和正

规相关系数。

Eigenvalues Function 1 Eigenvalue 1.239 aCanonical % of Variance 100.0 Cumulative % 100.0 Correlation .744 a. First 1 canonical discriminant functions were used in the analysis.

图7

(8) 图8表示各项的Wilk值、卡方值、自由度和显著性概率 Wilks' Lambda Test of Function(s) 1 Wilks' Lambda .447 Chi-square 22.571 df 2 Sig. .000

(9) 图9 表示各变量对应的判别函数的标准化系数值;

Standardized Canonical Discriminant Function Coefficients 舒张压kPa 胆固醇mmol/L Function 1 .884 .823 图9

(10) 图10表示判别变量与根据函数内相关系数绝对值大小排序的标准公

共判别函数变量之间的合并组内相关系数

Structure Matrix 舒张压kPa 胆固醇mmol/L Function 1 .625 .4 Pooled within-groups correlations between discriminating variables and standardized canonical discriminant functions Variables ordered by absolute size of correlation within function. 图10

(11) 图11是两组的相关性信息: Functions at Group Centroids Function 组别 1 2 Unstandardized canonical discriminant functions evaluated at group means 1 1.112 -1.042 图11

(12) 图12由三张表构成,表示各类先验概率和参与分析的为加权和经过

加权的个案数。

Classification Processing Summary Processed Excluded Missing or out-of-range group codes At least one missing discriminating variable Used in Output 31 0 0 31 Prior Probabilities for Groups Cases Used in Analysis 组别 1 2 Total Prior .500 .500 1.000 Unweighted 15 16 31 Weighted 15.000 16.000 31.000 Classification Function Coefficients 舒张压kPa 胆固醇mmol/L (Constant) 1 组别 2 7.043 6.457 -49.948 8.418 8.181 -73.191 Fisher's linear discriminant functions 图12

(13) 在操作结束后,SPSS会自动建立一项变量,显示其分组情况:

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- sarr.cn 版权所有 赣ICP备2024042794号-1

违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务