统计学实验报告
姓 名: 贾世光 071104109
许威 071104136 黄志宇 071103311
周浩 071103332
年级专业: 2011统计学 2011 财政金融学 2013年 5 月 17日 1
成 绩:
评 语:
指导教师: (签名)
2
实验一 统计数据的搜集与整理
一、实验目的:
1. 熟悉间接统计数据的搜集方法、搜集途径,能熟练通过网络搜集间接数据。
2. 掌握直接数据的搜集,特别是熟悉一项调查工作的各个环节,包括制定调查方案、
选取抽样框、设计问卷表、抽取样本、具体的调查和数据搜集过程。通过参与实际调查,掌握搜集直接数据的方法。
3. 掌握对不同类型的调查资料进行整理的方法,包括数据的审核、问卷的编码方法、
问卷的数据录入方法、对数据进行分组等。
二、实验原理:
利用网络,查阅文献对数据的收集,利用excel中的数据分析和函数语 言frequency对数据进行整理, 同时利用自动筛选和高级筛选对数据筛选。
三、实验所用软件及版本:Excel2003
四、实验主要内容:
1. 通过多种途径查询中国各省、直辖市2011年农村居民收入,并对其进行分组。 2. 某企业40名工人的月工资如下(单位:元):468、1220、1000、1150、880、770、
980、399、1280、920、620、790、1340、1070、590、1270、1180、810、488、1030、870、1110、660、750、1480、380、0、0、1180、1070、567、1350、1490、810、990、1080、610、0、750、840。要求:(1)利用Excel对40名工人的工资排序。(2)分别利用函数FREQUENCY和直方图两种方法,以组距为300进行等距离分组,第一组为300~600。
3. 已知甲、乙、丙、丁四家企业从1995-2005年的产量如下表,请分别用自动筛选
和高级筛选找出四家企业年产量同时大于1200的年份。
年份 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 4. 请完成下表
3
甲企业 1220 1600 1500 1520 1100 1880 10 10 1320 1680 1560 乙企业 1860 1800 1200 1800 1080 1060 1980 1420 1200 1900 1560 丙企业 1960 1580 1760 1240 1620 1620 1500 1840 1060 840 1220 丁企业 1220 1200 1140 1880 660 1340 1700 1480 1440 1380 1980
累计次数(人) 累计频率(%) 按月工资分组(元) 职工人数(人) 比重(%) 向上累计 向下累计 向上累计 向下累计 500以下 500-600 600-700 700-800 800以上 合计 16 50 23 14 7 110
五:实验过程步骤和结果报告 1.步骤
(1) 利用收索引擎收集资料
2) 将数据复制到excel中
3) 点击工具——数据分析——直方图,结果如下:
4
((
2.利用编辑栏的排序进行数据排序
2.步骤:1.将题中数据复制入excel文档
2.计算某企业40名工人的最大值,最小值,以及极差,得到如下:
5
3.利用函数frequency对数据进行等距分组,第一组为300-600,第二组为600-900,第三组是900-1200,第四组是1200-1500,即frequency(数据区域,数据上限),选好公式单元格区域后,按下回车键,再按f2,再按control+shift+enter,结果如下。
4.利用直方图对数据进行等距分组。
第一步,选择工具-加载宏+分析工具 第二步,在工具栏选择数据分析
第三步,在数据分析中选择直方图, 结果如下
三.(1)第一步,在数据菜单中选择筛选命令,再选择自动筛选。
第二步,单击自定义,指定〉1200,结果如下:
(2)第一步,建立条件区域
第二步,选择数据,筛选,高级筛选,结果如下:
6
四.利用excel中的计算,结果如下:
实验二 绘制统计图表
一、实验目的:
1.熟练利用Excel的统计制表功能,准确的反映统计总体的数量特征及其数量关系 2.熟练利用Excel的统计制图功能,生动、具体的反映统计总体的数量特征及其数量关系
3.掌握各种统计图、表的性能,并能准确的根据不同对象的特点加以应用 二、实验工具和知识准备:
1.Excel2003中“图表绘制”功能
2.Excel 2003中“数据分析”工具的“直方图”命令 3.什么是直方图、折线图、频数分布曲线? 4. 什么是条形图、柱形图? 5. 什么是饼图? 6. 什么是环形图?
三、实验所用软件及版本:Excel2003 四、实验主要内容:
1.已知某电视机生产企业在一个月内生产的产品中有250件为不合格品,经过调查知道产生不合格品的原因。整理数据如下。 原因 外观 电气故障 41 包装 78 喷漆 25 装配 37 其他 17 数量(件) 52 要求:(1)根据以上数据利用Excel绘制条形图。(2)根据以上数据计算各种原因的百分比,并画出饼图。
7
2.已知资料如下表: 年份 城镇居民家庭人均可支配收入(元) 农村居民家庭人均纯收入(元) 1980 1985 1990 1995 2000 2001 2002 2003 2004 2005 477 191 739 397 1510 4283 6280 6859 7702 8472 9421 10493 686 1577 2253 2366 2475 2622 2936 32 要求:利用Excel画出线图,并比较城乡居民收入差距的变化情况。 3.已知某咖啡厅一周咖啡销售如下表
布公主咖啡坊销售一览
星期一 特调咖啡 特调咖啡 单品咖啡 单品咖啡 巴西 巴西 曼特宁咖啡 曼特宁咖啡 曼特宁咖啡 单品咖啡 巴西 特调咖啡
星期二
星期五 统计时间:2002/12/21~2002/12/27
星期三 星期四 星期六 星期日 巴西 巴西 曼特宁咖啡 特调咖啡 单品咖啡 曼特宁咖啡 单品咖啡 曼特宁咖啡 单品咖啡 单品咖啡 曼特宁咖啡 单品咖啡 曼特宁咖啡 单品咖啡 巴西 单品咖啡 单品咖啡 巴西 单品咖啡 巴西 特调咖啡 特调咖啡 特调咖啡 单品咖啡 特调咖啡 单品咖啡 巴西 单品咖啡 单品咖啡 巴西 单品咖啡 单品咖啡 特调咖啡 特调咖啡 特调咖啡 特调咖啡 曼特宁咖啡 单品咖啡 巴西 曼特宁咖啡 巴西 巴西 特调咖啡 特调咖啡 巴西 低咖啡 低咖啡 巴西 巴西 美式咖啡 单品咖啡 单品咖啡 单品咖啡 特调咖啡 曼特宁咖啡 单品咖啡 单品咖啡 曼特宁咖啡 巴西 单品咖啡 低咖啡 特调咖啡 特调咖啡 巴西 请利用COUNTIF和SUM函数完整下表,同时根据表中数据给出条形图或者柱形图。 单位:杯 特调咖啡 巴西 单品咖啡 星期一 星期二 星期三 星期四 星期五 星期六 星期日 总计
曼特宁咖啡 低咖啡 美式咖啡 4.为评价家电行业售后服务的质量,随机抽取了由100个家庭构成的一个样本。服务质量的
等级分别表示为:A.好;B.较好;C一般;D.较差;E.差。调查结果如下:
8
B D A B C D B B A C E A D A B A E A D B C C B C C C C C B C C B C D E B C E C E A C C E D C A E C D D D A A B D D A A B C E E B C E C B E C B C D D C C B D D C A E C D B E A D C B E E B C C B E C B C
要求:
(1)指出上面的数据属于什么类型。 (2)用Excel制作一张频数分布表。
(3)绘制一张条形图,反映评价等级的分布。 (4)绘制评价等级的帕累托图。
5. 一种袋装食品用生产线自动装填,每袋重量大约为50g,但由于某些原因,每袋重量不会恰好是50g。下面是随机抽取的100袋食品,测得的重量数据如下: 单位:g 57 51 53 52 50 49 49 51 55
46 60 51 51 52 52 44 59 47 53
49 52 48 46 53 59 57 45 48 57
53 48 47 53 52 45 44 49
55 51 50 47 45 50 42 46 57 56
58 55 52 53 48 43 49 52 47 56
49 60 40 47 53 43 55 53 57
61 56 45 53 52 46 47 47 58 53
51 47 57 44 48 57 46 49 52 41
49 47 53 47 46 49 48 50 48 48
要求:
(1)构建这些数据的频数分布表。 (2)绘制频数分布的直方图。 (3)说明数据分布的特征。
五:实验过程步骤和结果报告 1. 步骤:
(1)将题中数据复制入excel文档
(2)选定数据——图标向导——条形图——完成
计算百分比,在外观/百分比那栏中输入=J2/$P$2,并且自动填充得出下表 原因 外观 电气故障 包装 41 78 喷漆 25 装配 37 其他 17 总计 数量(件) 52 250 百分比
20.80% 16.40% 31.20% 10.00% 14.80% 6.80% 100.00% 9
(3)选定数据——图标向导——饼图——完成
(4)右击饼图——数据系列格式,然后点选数据标志,点选百分比,确定
2. 步骤:
(1)将题中数据复制入excel文档
(2)选定数据,点选图表向导——标准类型——折线图
10
结论:城镇居民的家庭收入增长明显高于农村居民家庭人均收入 3. 步骤:
(1)将题中数据复制入excel文档
(2)利用COUNTIF和SUM函数完整下表 特调咖啡 巴西 单品咖啡 曼特宁咖啡 低咖啡 美式咖啡 星期一 3 3 3 3 0 0 星期二 0 0 1 3 0 1 星期三 4 1 7 0 0 0 星期四 1 4 8 0 0 0 星期五 1 0 3 0 0 0 星期六 6 6 3 0 0 0 星期日 2 4 0 0 3 0 总计 17 18 25 6 3 1 (3)选定表中数据,点击“图表向导”——“标准类型”——“条形图”,形成下图 11
4. 步骤:
(1) 将题中数据复制入excel文档 (2) 运用countif函数得出下表 等级 好 较好 一般 较差 差 调查结果 频数 A B C D E 总计 14 21 32 17 16 100 (3) 选定表中数据,点击“图表向导”——“标准类型”——“条形图”
12
(4) 对频数进行从小到大的顺序排列,计算出累计百分数,形成新的频数分布表 等级 调查结果 频数 累计百分比 一般 较好 较差 差 好 C B D E A 0 32 21 17 16 14 0.00% 32.00% 53.00% 70.00% 86.00% 100.00% (5) 选定数据,点击“图表向导”——“自定义类型”——“两轴线—柱图”——“完
成”
5. 步骤:
(1) 将题中数据复制入excel文档
(2) 运用max和min函数计算最大值和最小值,确定组数,由于分组的目的之一是观察
数据分布的特征,因此组数的多少应适中,由函数得出的最大值和最小值为61和40,由于本题数据较多,可分为10组
(3) 确定组距为2,根据分组整体成频数分布表。点击“工具”——“加载宏”——“分
析数据库”,点击“工具”——“数据分析”——“直方图”,输入区域为数据,接收区域为每组的上限,点选“图表输出”和“确定”
(4) 得出下图
13
结论:袋装食品用生产线自动装填,每袋重量集中于44到之间,但由于某些原因,每袋重量不会恰好是50g。
14
实验三 统计数据的描述
一、 实验目的:
1. 了解描述统计的基本特征
2. 学会用Excel计算平均数、众数、中位数等集中趋势指标 3.能够使用Excel计算全距、四份位距、方差、标准差等变异指标 二、实验工具和知识准备:
1.Excel 2003中“数据分析”工具的“描述统计”命令
2.Excel 2003中“数据分析”工具的“排位与百分比排位”命令 3.Excel2003中的部分函数及公式 4.什么是描述统计?
5.常用的数据特征指标有哪两种趋势? 6.集中趋势指标主要有那些? 7.变异指标有哪些? 8.其他指标。
三、实验所用软件及版本:Excel2003 四、实验主要内容:
1.某食品公司为了了解客户的支付方式和金额,做了抽样调查并得到样本资料如下(单位:美元):
现金支付 7.40 4.75 8.81 7.41 12.07 14.28 4.34 5.80 15.57 11. 7.02 1.09 16.38 0 个人支票 27.6 41.58 2.67 58. 43.14 48.95 28.58 52.87 31.07 49.21 59.78 42.69 37.2 17.87 信用卡支付 50.3 25.57 46.13 43.79 52.35 55.21 53.32 69.77 0 0 0 0 0 0 现金支付 5.51 15.1 1.85 11.77 9.00 1.27 3.31 20.48 6.93 13.09 18.09 2.96 8.85 0 个人支票 30.6 36.09 34.67 57.59 21.11 36.48 35. 78.16 35.38 31.74 72.46 41.1 .84 69.22 信用卡支付 33.76 46.42 14.44 19.78 52.63 .19 26.57 48.11 0 0 0 0 0 0 现金支付 5.98 7.88 5.91 3.65 20.48 2.87 15.07 16.28 7.17 16.69 2.44 11.17 7.22 个人支票 52.04 18.77 42.83 55.4 78.16 51.66 39.55 25.96 58.11 50.58 37.94 40.51 58.75 信用卡支付 57.55 27.66 44.53 26.91 48.11 22.59 27. 0 0 0 0 0 0 要求
(1)利用函数分别求现金支付、个人支票和信用卡支付的中位数、算数平均数、众数、最大值、最小值、四分位距离、样本标准差、样本方差。
(2)运用Excel对此样本数据作出分析,并写出分析报告,分析报告应包括:(1)利用各种描述统计指标概括样本数据(中位数、算术平均值、众数、最大值、最小值、四份位距离、
15
样本标准差、样本方差);(2)对于各个平均数的比较和理解;(3)对于各个标准差的比较和理解。
2. 某生产车间50名工人日加工零件数(单位:个)如下。
117 122 124 129 139 107 117 130 122 125 108 131 125 117 122 133 126 122 118 108 110 118 123 126 133 134 127 123 118 112 112 134 127 123 119 113 120 123 127 135 137 114 120 128 124 115 139 128 124 121 分别利用函数和数据分析的统计描述对工人加工零件数的统计信息进行描述
3.在某地区抽取120家企业,按利润额进行分组,结果如下:
按利润额分组(万元) 企业数(个) 200~300 19 300~400 30 400~500 42 500~600 18 600以上 11 合 计 120 要求:
(1)计算120家企业利润额的平均数、中位数、众数、标准差和离差系数。 (2)计算分布的偏态系数和峰态系数。
五:实验过程步骤和结果报告 1. 步骤:
(1) 利用函数算,例如众数=mode(选中区域),结果如下:
16
2. (2)利用excel
(3)结论:a.顾客的支付方式最多是个人支票为43.5961,其次是信用卡支付为23.11171,最少的是现金支付,为8.71902439
b.顾客支付最小的标准差是现金支付,其次是个人支付,最大的是信用卡支付,即顾客支付方式使用最稳定的是现金支付,其次是个人支付,最不稳定的是信用卡支付。
2.步骤:
(1)某生产车间50名工人日加工零件数 利用函数
17
利用数据分析
(2)结论:工人加工的零件数平均是122.98,中位数是123,众数是122,最大值是139,最小值是107,工人加工的零件数样本标准差是8.026715596,所以加工的零件数差距比较大,不稳定。
3.步骤:
(1)将数据复制到excel中。 (2)制作表格 按利润额分企业数(个) 组中值(m) 组(万元) 200~300 300~400 400~500 500~600 600以上 合 计 19 30 42 18 11 120 m与企业个数的乘积 4750 10500 100 9900 7150 51200 250 350 450 550 650 (3)点选“工具”—“加载宏”,再点选数据—“数据分析”中的描述统计
18
列1 平均 426.6666667 标准误差 10.63352695 中位数 450 众数 450 标准差 116.4844515 方差 13568.62745 峰度 -0.624699913 偏度 0.208442033 区域 400 最小值 250 最大值 650 求和 51200 观测数 120 最大(1) 650 最小(1) 250 置信度(95.0%) 21.0515 运用函数离差系数=标准差/平均数,即10.63352695/426.6666667=0.0249223 19
实验四 假设检验
一、实验目的:
1.掌握t检验的概念和使用方法 2.利用t检验解决实际问题 二、实验工具和知识准备:
1.Excel 2003中“数据分析”工具的“t检验:成对双样本分析”命令 2.Excel 2003中“数据分析”工具的“t检验:双样本等方差假设”命令 3.Excel 2003中“数据分析”工具的“t检验:双样本异方差假设”命令 三、实验所用软件及版本:Excel2003 四、实验主要内容:
1. 某商场计划采用一种新的售货奖励办法,为对新办法进行评估,选定5名售货员试行了一周,试行前后的销售额数据。
售货员编号
1
试行后的销
试行前的销售额(万元) 售额(万元)
12
14
2 15 18 3 16 18 4 15 18 5 18 19
要求在显著性水平0.05下判断新的售货奖励办法是否明显增加销售额?
2. 从甲、乙两煤矿生产的原煤中各抽取一个样本,测得其灰分率数据。根据过去经验,两煤矿原煤灰分率的方差相等,要求在显著性水平0.05下用“t-检验”工具判断两煤矿原煤的平均灰分率有无显著差异?
甲矿灰分率 乙矿灰分率
16.9 16.7 18.2 20.2
20.8 17.4 20.3 23.7 21.3
3. 某产品可用两种方法装配,现各抽取12件记录其装配时间(分钟)。假定两种装配方法
所花时间的方差不等,要求在显著性水平0.05下用“t-检验”工具判断两种方法的装配时间有无显著差异? 装配时间 甲方法 35 32 34 31 29 38 30 34 32 29 26 31 (分钟) 乙方法 29 28 24 26 30 32 29 31 26 32 26 29 五:实验过程步骤和结果报告
一、研究新的销售办法对销售额的影响 1.将题目数据复制如Excel中
2.因为题目是对比销售额的差距,又为小样本,所以使用t检验
3.[工具]→[数据分析]→[t检验,成对双样本均值分析],对数据进行分析,作出下表:
20
4.P值小于α=0.05
分析:由表得,P单尾检验值0.002<α=0.05,所以拒绝原假设,新的售货奖励办法能明显增加销售额。
二、研究两煤矿原煤的平均灰分率有无显著差异
1.由题目已知,两煤矿原煤灰分率的方差相等,题目为小样本且方差未知,并判断平均灰分率有无显著差异,所以选择双样本等方差检验
2.[工具]→[数据分析]→[t检验,双样本等方差检验],作出下表:
3.表中,P双尾值<α=0.05 分析:由表得,P双尾检验值0.08>α/2=0.025,所以不拒绝原假设,两煤矿原煤的平均灰分率没有显著差异
三、研究某产品两种方法的装配时间有无显著差异
1.题目告知方差不等且为未知,样本数量为小样本,宜采用双样本异样本 2.[工具]→[数据分析]→[t检验,双样本等方差检验],作出下表:
21
3.P双尾值小于α=0.05
分析:由表得,P双尾检验值为0.012<α/2=0.025,所以拒绝原假设,两种方法的装配时间有显著差别
22
实验五 方差分析
一、实验目的:
1.了解方差分析的意义、作用及应用范围 2.掌握方差分析的简单运用,会应用方差分析解决实际问题 二、实验工具和知识准备:
1.Excel 2003中“数据分析”工具的“方差分析:单因素方差分析”命令
2.Excel 2003中“数据分析”工具的“方差分析:无重复双因素方差分析”命令 3.Excel 2003中“数据分析”工具的“方差分析:可重复双因素方差分析”命令 4.什么是方差分析?
三、实验所用软件及版本:Excel2003 四、实验主要内容:
已知大白鼠核黄素和食物的供给会对尿液中氨基氮的排出量有影响。现在以此做方差分析。
1. 对大白鼠进行核黄素控制,控制水平分别为满足供应(100%),略低(70%)、很低(40%)
以及极度控制(10%),得到四组不同大白鼠的尿液氨基氮水平,数据如下,试比较这四种控制水平下的大白鼠尿液中氨基氮含量平均水平。 大白鼠编号 满足供应(100%) 略低(70%) 很低(40%) 极度控制(10%) 1 2 3 4 5 6 7 8 9 10 11 6.85 7.16 7.2 7.05 8.48 7.88 7.83 8.72 7.69 8.76 8.62 6.9 6.58 6.73 5.91 5.79 6.75 6.48 6.71 6.41 7.1 5.95 5.69 6. 5.88 6.5 4.5 3.5 6.17 3.36 4.39 3.43 4.51 2.7 3.21 4.61 3.69 2.29 3.88 3.72 2.88 3.43 5. 1.9
2. 下表提供了限定核黄素和限定食量时大白鼠尿液中氨基氮含量的数据,每组因素都给出
23
一只大白鼠观察值。
满足供应(100%) 略低(70%) 很低(40%) 极度控制(10%) 8.8 8.29 8.19 7.6 7.26 6.97 6.51 6. 6.6 5.99 5.53 8.34 7.81 7.47 7.41 7.16 6.65 6.24 6.09 5.41 4.96 4.63 8.18 7.46 7.09 6.67 6.1 5.91 5.55 4.71 4.35 4.29 3.81 7.61 7.16 6.56 6.22 5.99 5.39 4.92 4.08 3.49 2.9 3.24 不限 90% 80% 70% 60% 50% 40% 30% 20% 10% 0%
3.根据下表数据进行方差分析 满足供应(100%) 8.8 8.65 8.6 8.29 8.51 8. 8.19 7.91 8.31 7.6 7.77 7.55 7.26 7.5 7.6 6.9 6.97 7.26 略低(70%) 8.34 7.81 7.47 7.41 7.16 6.65 6.24 6.09 5.41 8.34 8.01 7.57 7.13 7.04 6.36 5.87 6.07 5.16 很低(40%) 极度控制(10%) 7.6 7.58 6.9 不限 90% 80% 70% 60% 50% 40% 30% 20% 8.33 8.18 8.01 7.82 7.61 8.09 7.46 7.66 7.73 7.16 6.93 7.05 6.67 6.63 6.67 7.5 7.09 7.06 7.07 6.56 6.43 6.52 7 6.22 5.91 6.29 5.4 5.93 5.1 5.15 6.1 6.41 6.33 5.99 6.82 5.91 5.59 5.94 5.39 6.51 7.05 6.76 6. 6.36 6.51 6.6 6.25 5.96 6.27 5.55 5.69 5.38 4.92 5.01 4.53 5.75 4.71 5.38 4.93 4.08 4.42 4.65 5.37 4.35 4.21 4.48 3.49 3.86 3.68 五:实验过程步骤和结果报告
一、研究不同的核黄素控制水平对大白鼠对尿液中氨基氮的排出量的影响。 1.讲题目数据复制如Excel中 2.[工具]→[加载宏]→[数据分析]
3.题目只有核黄素控制水平,所以为单因素方差分析,选择[数据分析]中的单因素方差分析,以题目数据为输入区域,作出下表:
24
4.表中,P值为3.05E-13<α=0.05
分析:由表得,方差分析表中的P=3.0528E-13<α=0.05,所以拒绝原假设,不同的核黄素控制水平对大白鼠尿液中氨基氮含量有显著影响
二、研究核黄素控制水平和限定食量对大白鼠对尿液中氨基氮的排出量的影响。
1.题目中有不同水平的核黄素控制量和不同程度的限定食量,所以选择无重复双因素分析 2.选择[工具]→[数据分析]→[无重复双因素方差分析],作出下表:
25
3.由表得,行P值小于α=0.05,列P值小于α=0.05
分析:用于检验行因素的P=5.86E-17<α=0.05,所以拒绝原假设,限定食量对大白鼠尿液中氨基氮含量有显著影响
用于检验列因素的P=3.4516E-13<α=0.05,所以拒绝原假设,限定核黄素对大白鼠尿液中氨基氮含量有显著影响
三、研究核黄素控制水平和限定食量以及两因素的共同作用对大白鼠对尿液中氨基氮的排出量的影响。
1.使用选择性粘贴中的”转置”,使行因素变为核黄素控制水平,使列因素变为限定食量,如图:
26
2.[工具]→[数据分析]→[双因素重复方差分析],以题目数据为基础,作出下表:(省略部分)
3.由表得:样本因素P值<α=0.05,列因素P值<α=0.05,交互P值<α=0.05
分析:由表得,用于检验行因素的P=1E-45<α=0.05,所以拒绝原假设,控制核黄素对大白鼠尿液中氨基氮含量有显著影响
用于检验列因素的P=9E-56<α=0.05,所以拒绝原假设,食量对大白鼠尿液中氨基氮含量有显著影响
用于检验交互作用的P=2E-05<α=0.05,所以拒绝原假设,控制核黄素和食量对大白鼠尿液中氨基氮含量有显著影响
27
实验六 相关与回归分析
一、实验目的:
1.掌握相关分析与回归分析的概念; 2.掌握相关分析、回归分析等统计分析方法 3.掌握回归预测的基本概念
4.学会使用Excel回归分析工具对实际问题进行回归预测 二、实验工具和知识准备:
1.Excel 2003中“数据分析”工具的“相关系数”命令 2.Excel 2003中“数据分析”工具的“回归”命令 3.Excel2003中“图表绘制”功能 4.什么是相关分析? 5.什么是回归分析? 6.相关系数的显著性检验t
rn21r2
7..线性预测方法
三、实验所用软件及版本:Excel2003 四、实验主要内容:
1. 农场通过实验取得早稻收获量与春季降雨量、春季温度的数据如下:
收获量(公斤/公顷) 2250 3450 4500 6750 7200 7500 8250 降雨量(毫米) 25 33 45 105 110 115 120 温度(摄氏度) 6 8 10 13 14 16 17 要求:(1)绘制早稻收获量与春季降雨量、春季温度的散点图;(2)运用Excel求收获量、降雨量、温度之间的相关系数矩阵。
2. 某大型连锁店调查了12家分店的营业收入和营业支出,结果如下表所示:(单位:万元) 编号 1 支出 5 收入 8 2 8 12 3 6 7 4 4 5 5 8 11 6 9 13 7 11 15 8 12 19 9 5 4 10 6 8 11 9 10 12 7 9 要求:(1)判断营业支出和营业收入呈何种相关关系?请以散点图说明;(2)若营业支出与营业收入呈线性相关性,请在Excel中运用“添加线性趋势线”、函数法、数据分析工具等
28
三种方法拟合线性方程,并判断该方程是否能说明现象的实际情况。(3)预测当营业支出为10,15,20时,营业收入是多少?
五:实验过程步骤和结果报告
实验1:
步骤:一,1、将题中数据复制入excel文档
2、点击excel文档中的“图表向导”-“XY散点图”-“下一步”-“系列”-“X值导入降雨量数据,Y值导入收获量数据”-“早稻收获量与春季降雨量的散点图” 3、步骤同2,得出早稻收获量与春季温度的散点图,如下:
降雨量(毫米)90008000700060005000降雨量(毫米)40003000200010000050100150
早稻收获量与春季降雨量的散点图
温度(摄氏度)90008000700060005000温度(摄氏度)4000300020001000005101520
早稻收获量与春季温度的散点图
29
二,1、选择“工具”—“加载宏”—“分析工具库”。
2、“分析工具库”-“相关”-导入表格数据”-“收获量、降雨量、温度之间的相关系数矩阵”,如下:
收获量(公斤/公顷) 降雨量(毫米) 温度(摄氏度) 收获量(公斤/公顷) 降雨量(毫米) 温度(摄氏度) 1 0.983592787 1 0.97052 0.965066573 1 实验2: 步骤一:点击excel文档中的“图表向导”-“XY散点图”-“下一步”-“导入表格数据”,得营业支出和营业收入的散点图,如下:
图表标题201816141210820051015收入y线性 (收入y)y = 1.6343x - 2.1741
由图可判断营业收入与营业支出呈线性关系。 步骤二:1、“点住图上一点”-“点左键”-“点右键”-“添加趋势线”-“选项”-“显示公式”,得用添加趋势线方法拟合的线性方程为y=1.6343x-2.1741.
2,函数法:分别计算出xy、x^2、x平均、y平均、x的总和、y的总和、x^2的总和、xy的总和,然后利用最小二乘法公式分别计算出a=1.6343,b=-2.1741,由此得拟合的线性方程为y=1.6343x-2.1741. 3、数据分析法:“数据分析”-“回归”-“分别导入X,Y值”-“输入接收区域”-“点击确定”,得如下结果:
30
分析如下:由分析数据可得拟合的线性的方程为y=1.6343x-2.1741,又由于R Square=0.96679776650,即营业收入的变动中,.97%可由营业支出解释,故该方程可以说明实际情况。
3、如下:当x=10时,营业收入y=14.16 当x=15时,营业收入y=22.3404
当x=20时,营业收入y=30.5119
31
实验七 时间序列
一、实验目的:
二、实验工具和知识准备:
三、实验所用软件及版本:Excel2003 四、实验主要内容:
1. 下表是1981年—2000年我国油彩油菜籽单位面积产量数据(单位:kg / hm2)
年份 1981 1982 1983 1984 1985 1986 1987 1988 19 1990 单位面积产量 1451 1372 1168 1232 1245 1200 1260 1020 1095 1260 年份 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 单位面积产量 1215 1281 1309 1296 1416 1367 1479 1272 1469 1519 (1)绘制时间序列图描述其形态。 (2)用5期移动平均法预测2001年的单位面积产量。
(3)采用指数平滑法,分别用平滑系数a=0.3和a=0.5预测2001年的单位面积产量,分析预测误差,说明用哪一个平滑系数预测更合适?
32
2. 下表是1981年—2000年我国财政用于文教、科技、卫生事业费指出额数据
年份 1981 1982 1983 1984 1985 1986 1987 1988 19 1990 支出(万元) 171.36 196.96 223. 263.17 316.70 379.93 402.75 486.10 553.33 617.29 年份 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 支出(万元) 708.00 792.96 957.77 1278.18 1467.06 1704.25 1903.59 21.38 2408.06 2736.88 (1)绘制时间序列图描述其趋势。 (2)选择一条适合的趋势线拟合数据,并根据趋势线预测2001年的支出额。
3. 下表中的数据是一家水产品加工公司最近几年的加工量数据(单位:t)。对该序列进行分解,计算季节指数、剔除季节变动、计算剔除季节变动后趋势方程。
年/月 1 2 3 4 5 6 7 8 9 10 11 12 1997 78.8 78.1 84.0 94.3 97.6 102.8 92.7 41.6 109.8 127.3 210.3 242.8 1998 91.9 92.1 80.9 94.5 101.4 111.7 92.9 43.6 117.5 153.1 229.4 286.7 1999 90.4 100.1 114.1 108.2 125.7 118.3 .1 46.1 132.1 173.9 273.3 352.1 2000 66.8 73.3 85.3 94.6 74.1 100.8 106.7 44.0 132.1 162.5 249.0 330.8 2001 99.5 80.0 108.4 118.3 126.8 123.3 117.2 42.0 150.6 176.6 249.2 320.6
五:实验过程步骤和结果报告 试验1:1、“图表向导”-“折线图”-“导入数据范围”-“确定”,得如下图形:
33
其形态为:不含有趋势,有一定的随机性。 2、步骤:1、“数据分析”-“移动平均”-“导入数据区域”-“间隔为5”-“导入输出区域”-“确定”。 2、“数据分析”-“指数平滑”-“导入数据区域”-“阻尼系数为0.7”-“导入输出区域”-“确定”
3、步骤同2,将阻尼系数改为0.5。
4、分别计算预测误差、误差平方及合计。以上4步骤得如下结果:
分析:,用5期移动平均法预测的2001年的产量为1421.2,由于a=0.5的指数平滑法预测值得误差平方小于a=0.3的指数平滑法预测值的误差平方,故用a=0.5的平滑系数更为合适。 实验2:1、“图表向导”-“折线图”-“导入数据范围”-“确定”,得如下图形
34
其趋势为:其趋势为持续上升的指数形式。
2、点击上图中的一点,点右键,添加趋势线,系列,显示公式。得拟和的曲线方程:y=145.78*exp(0.1491x),则预测的2001值为3338.239。 实验3:1、“将数据导入excel表格”-“数据分析”-“移动平均”-“导入数据范围”-“间隔12”-“导入输出区域”-“确定”,得12期移动平均数据。 2、对12期移动平均数据进行2期移动平均(步骤如上),得中心化移动平均值。 3、计算加工量与移动平均值的比值。得如下表:
35
36
续上表
2、将上面表格中的整理成表格,并分别计算合计,平均,总平均,季节指数(其中季节指数等于平均除以总平均,平均为各季度比值的平均,总平均为所有比值的平均),得如下表:
3、计算季节分离后的序列Y/S,其中Y为加工量、S为季节指数,根据季节分离后的序列制作散点图,步骤如下:1、“图表向导”-“折线图”-“导入数据范围”-“确定”。
2、点击上图中的一点,点右键,添加趋势线,系列,显示公式。得拟和的曲线方程:y=0.4324x+116.44,如图:
37
对以上数据进行整理,计算回归趋势值、最终预测值、预测误差得如下表格:(其中回归趋势值即为时间编号t即(x),代入上面拟合趋势方程所得值,最终预测值为季节指数S乘以回归趋势值,预测误差为最终预测值减去实际加工量)
38
39
因篇幅问题不能全部显示,请点此查看更多更全内容
Copyright © 2019- sarr.cn 版权所有 赣ICP备2024042794号-1
违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com
本站由北京市万商天勤律师事务所王兴未律师提供法律服务