您好,欢迎来到飒榕旅游知识分享网。
搜索
您的当前位置:首页非参数统计部分课后练习习题参考答案.docx

非参数统计部分课后练习习题参考答案.docx

来源:飒榕旅游知识分享网


课后习题参考答案

第一章 p23-25

2、( 2)有两组学生,第一组八名学生的成绩分别为

二组三名学生的成绩分别为

u): H0: u=100 H 1:u<100。第一组数据的检验结果为:

x1: 100, 99,99,100,99, 100, 99,99;第

a=的t检验 (假设总体均值为

H0:

x2:75,87,60 。我们对这两组数据作同样水平

df=7 , t 值为,单边 p 值为,结论为“拒绝

u=100。”(注意:该组均值为) ;第二组数据的检验结果为: df=2 , t 值为,单边p值为 ; 结论为“接受 H0: u=100。”(注意:该组均值为) 。你认为该问题的结论合理吗说出你的理由,并提出该如何解决这一 类问题。

答:这个结论不合理( 6 分)。因为,第一组数据的结论是由于p-值太小拒绝零假设,这时可能犯第一 类错误的概率较小,且我们容易把握;而第二组数据虽不能拒绝零假设,但要做出“在水平a时,接受 零假设”的说法时,还必须涉及到犯第二类错误的概率。

( 4 分)然而,在实践中,犯第二类错误的概率

多不易得到,这时说接受零假设就容易产生误导。实际上不能拒绝零假设的原因很多,可能是证据不足 (样本数据太少) ,也可能是检验效率低,换一个更有效的检验之后就可以拒绝了,当然也可能是零假 设本身就是对的。本题第二组数据明显是由于证据不足,所以解决的方法只有增大样本容量。 第三章 p68-71

3、在某保险种类中,一次关于

1998 年的索赔数额(单位:元)的随机抽样为(按升幂排列)

5064 元。

4632 ,4728, 5052, 5064, 5484, 6972, 7596, 9480 ,14760,15012, 18720, 21240, 22836, 52788,

(4 分)

67200。已知 1997 年的索赔数额的中位数为 ( 2)利用符号检验来回答( ( 3)找出基于符号检验的

( 1)是否 1998 年索赔的中位数比前一年有所变化能否用单边检验来回答这个问题(

1)的问题(利用精确的和正态近似两种方法) 95%的中位数的置信区间。 (8 分)

4 分)

。( 10 分)

5064 元是有变化,但

解:( 1) 1998 年的索赔数额的中位数为 9480 元比 1997 年索赔数额的中位数

这只是从中位数的点估计值看。 如果要从普遍意义上比较

1998 年与 1997 年的索赔数额是否有显着变化, (4 分)

还得进行假设检验,而且这个问题不能用单边检验来回答。

( 2)符号检验( 5 分)

设假设组: H0 :M= M0 = 5064 H

: M≠ M0 = 5064

符号检验:因为 n+=11, n-=3 ,所以 k=min(n+,n-)=3

3

精确检验:二项分布

b(14, ,

b(14,1/ 2) 0.0287

n

0

,双边p-值为 , 大于a=,所以在a水平下,

样本数据还不足以拒绝零假设;但假若a=,则样本数据可拒绝零假设。查二项分布表得a=的临界值为( 3,11),同样不足以拒绝零假设。

正态近似:(5 分) np=14/2=7,npq=14/4= z=(3+/

3.5 ≈ >Za/2 =

仍是在a=的水平上无法拒绝零假设。说明两年的中位数变化不大。 (3)中位数 95%的置信区间: ( 5064, 21240)(8 分) 7、一个监听装置收到如下的信号:

0,1,0,1,1,1,0,0, 1, 1, 0,0,0,0,1,1,1,1, 1,

1, 1,1, 1, 0,1, 0, 0, 1, 1, 1, 0, 1, 0, 1, 0,1, 0, 0, 0, 0,0, 0, 0, 0, 1, 0,1, 1, 0,

0, 1, 1,1, 0, 1, 0, 1, 0,0, 0, 1, 0,0, 1, 0, 1, 0, 1,0, 0, 0, 0, 0, 0, 0, 0。能否说该

信号是纯粹随机干扰( 解:建立假设组:

10 分)

H 0:信号是纯粹的随机干扰

H1:信号不是纯粹的随机干扰( 2 分)

游程检验:因为 n1 =42, n2 =34, r=37 。( 2 分)根据正态近似公式得:

U =

2 42

34

1 38.58

2

42 34(2 42 34 42 34)

(42 34)(42 34 1)

42 34

2

18.33 ( 2

分 )

Z

37 38.58

0.086 ( 2 分)

a / 2

18.33

取显着性水平a=,则Z 第四章 p91-94

= , 故接受零假设,可以认为信号是纯粹的随机干扰的。 (2 分)

1、在研究计算器是否影响学生手算能力的实验中, 13 个没有计算器的学生(A组)和 10 个拥有

计算器的学生(B组)对一些计算题进行了手算测试.这两组学生得到正确答案的时间(分钟)分别如下:

A组: 28, 20 , 20, 27, 3, 29, 25, 19, 16, 24, 29, 16, 29 B组: 40,31, 25 , 29, 30, 25, 16, 30, 39, 25

能否说A组学生比B组学生算得更快利用所学的检验来得出你的结论.

解、利用 Wilcoxon 两个独立样本的秩和检验或

两组学生的快慢一致;

H

(12 分)

Mann-Whitney U 检验法进行检验。建立假设组:

H0:

1

: A 组学生比 B 组学生算得快。 (2 分)

两组数据混合排序(在

39, 40( 2 分)

B 组数据下划线) :

3, 16, 16, 16,19,20,20,24, 25,25,25, 25, 27, 28, 29, 29 , 29 , 29 , 30, 30 ,31,

A 组秩和 RA= 1+3*2+5+*2+8++13+14+*3=120;

B 组秩和 RB= 3+*3++*2+21+22+23=156 ( 2 分) A 组逆转数和 U =120-(13*14)/2=29

A

B 组逆转数和 UB=156-(10*11)/2=101

值,所以用正态近似。计算

(2 分)

当 nA=13, nB=10 时,样本量较大,超出了附表的范围,不能查表得

Mann-Whitney 秩和检验的临界

Z

36 260

U A nA nB / 2

29 13*10/2

nA nB (nA

nB 1) /1213* 10 * (13 10 1)/12

36

2.2326

(2 分)

16.1245

当显着性水平 a 取时,正态分布的临界值 Z =(1分)

a/2

由于 Z4、在比较两种工艺(A和B)所生产的产品性能时,利用超负荷破坏性实验。记下损坏前延迟的

时间名次(数目越大越耐久)如下: 方法:ABBABABAABAAABABAAAA

序: 1234567891011121314151617181920

用 Mann-Whitney 秩和检验判断A工艺是否比B工艺在提高耐用性方面更优良(

解、设假设组: H:两种工艺在提高耐用性方面的优良性一致;

0

10 分)

1: A 工艺比 B 工艺更优良( 1 分,假设也可用符号表达式) H

根据样本数据知 n =13; n =7( 1 分),计算

A B

A 工艺的秩和 RA= 1+4+6+8+9+11+12+13+15+17+18+19+20=153;(1 分)

B 工艺的秩和 RB= 2+3+5+7+10+14+16=57( 1 分)

A 工艺的 Mann-Whitney 秩和 UA=RA-n A(n A+1)/2=153-(13*14)/2=62 (1分) B 工艺的 Mann-Whitney 秩和 U=R -n (n +1)/2=57-(7*8)/2=29 (1 分)

BBBB

当 nA=13,nB=7 时,样本量较大, 超出了附表的范围, 不能查表得 Mann-Whitney 秩和检验的临界值,所以用正态近似。计算

Z

U A nAnB / 2

62 13* 7/2

nAnB (nA nB 1) /12 16.5 159.25

13* 7 * (13 7 1) /12

16.5 12.6194

1.3075

(2 分)

Za/2 =( 1 分) 当显着性水平 a 取时,正态分布的临界值

由于 Za/2 0

一致, A 工艺并不比 B 工艺更优良。( 1 分) 第五章 p118-121

1、对 5 种含有不同百分比棉花的纤维分别做

8 次抗拉强度试验, 试验结果如表 4 所示(单位:g/cm2):

表 4

棉花纤维百分比( %)

15

抗拉强

411 705 493 634 634 846 564 705

20 1268 846 1057 916 1057 1127 775 634

25 1339 1198 1339 1198 1339 916 1480 1268

30 1480 1198 1268 1480 1268 986 1127 1480

35 986 775 493 775 352 352 564 423

试问不同百分比纤维的棉花其平均抗拉强度是否一样,利用

解:建立假设组:

H0:不同百分比纤维的棉花其平均抗拉强度一样; H :不同百分比纤维的棉花其平均抗拉强度不一样。

1

Kruskall — Wallis 检验法。 (14 分 )

(2 分)

已知, k=5,n1= n 2= n 3= n 4= n 5=8( 2 分)。混合排序后各观察值的秩如表

4 所示:

表 4

15

20

棉花纤维百分比( %)

25 35 28 35 28 35

15 10 166

8

8

30

35 15

抗拉强

3

28

10 10

15

4

R nj

8 8 8

根据表 4 计算得:( 6 分)

k

H

12 78.52

R 2j

N ( N 1) j 1 n j 12

3( N 1)

1662 250.52

253.52 71.52

由于自由度 k-1=5-1=4 , n = 8>5,是大样本,所以根据水平

40 41 28.6857

8

3 41

2

C=,( 2 分)

a=,查 X 分布表得临界值

j

因为 Q>C,故以 5%的显着水平拒绝

H0 假设,不同百分比纤维的棉花其平均抗拉强度不一样。 (2 分)

7、按照一项调查, 15

名顾客对三种电讯服务的态度( “满意”或“不满意” )为( 15 分) 服务

消费者 ( 爱好用“ 1”表示,不爱好用“

0”表示 )

合计

A 1 1 1 1 1 1 1 1 0 1 1 1 1 1 0 13 B 1 0 0 0 1 1 0 1 0 0 0 1 1 1 1 8

C

0

0

0 1

0

0

0

0

0

0

0 1

0 0 0 2 合计 2 1 1 2 2 2 1 2 0 2

1 H :顾客对 1 1 3

解:建立假设组:2

23

3 种服务的态度无显着性差异;

0

H1:顾客对 3 种服务的态度有显着性差异。 (2 分)

本例中, k=3, n=15。( 2 分)又因

xi

yj 23

Xi2 13

2

82

2

2

169 64 4 257

y2

j

4 1

4 1

43

2

3(3 1) 257 23

3 18.6154

3

23 43

( 5 分)自由度 k-1=3-1=2 ,( 2 分)取显着性水平

a=,查 X2 分布表得临界值 c=,( 2 分)因为 Q>C,故以 5%的显着水平拒绝 H0 假设,即顾客对 3 种服务的态度有显着性差异。 (2 分)

8、调查 20 个村民对 3 个候选人的评价,答案只有“同意”或“不同意”两种,结果见表

1:

表 1

候选人

20 个村民的评价( “同意”为 1,“不同意”为 0)

A 1 1 0 0 0 0 1 0 0 0 1 0 0 1 1 0 0 1 1 1 B

0 1 1 0 1 0 1 1 0 0 0 1 0 0 0 1 0 0 0 1 C

0 0

1 1

1 1

0

0

0

0 1

0 1 1

1

1 1

0 1

0

试检验村民对这三个候选人的评价有没有区别

解:建立假设组:

H0:三个候选人在村民眼中没有区别

H :三个候选人在村民眼中有差别(

2 分)

1

数据适合用 Cochran Q 检验( 2 分)。

而且已知 n=20, k=3,∑ xi =∑ yj = 28。( 2 分)

计算结果见表

3:

表 3

3 个候 选人 A B C Yj

20 个村民的评价( “同意”为 1,“不同意”为 0)

Xi 1 1

9 8

1 1 0 1 0 0

0 1 1

0 0 1

0 1 1

0 1 0 1 1 0

0 0 1 0 0 0

0 0 0

1 0 1

0 1 0

0 0 1

1 0 1

1 0 0 1 1 1

0 1 1 0 0 0 1 0 1

0 11

122121210021122 2112228

根据表 2 计算得:

xi2 9 2 y 2j 12

82 112 266 2 2

2 2 48 (2 分)

(

xi )2

k

Q

k (k

1)[

xi

2

k y j

yj

2

3(3 1)( 266 282 )

3

3 28 48

(2 分)

0.7778

取显着性水平a=,查卡方分布表得卡方临界值 选人在村民眼中没有区别。 ( 2 分)

C=,由于 Q第八章 P170-171

2. 下面是某车间生产的一批轴的实际直径(单位:

mm):

能否表明该尺寸服从均值为 10,标准差为的正态分布

( 分别用 K-S 拟合检验和卡方拟合检验 ) 。当

n=10,a=时查表得 K-S 拟合检验的临界值为。 ( 24 分)

解:建立假设组: H :该车间生产的轴直径服从均值为

0

10,标准差为的正态分布;

H1:该车间生产的轴直径服从均值为

中。

10,标准差为的正态分布( 2 分)

首先将样本数据按升序排列,并对数据进行标准化处理,即 (1) K-S 正态拟合检验见表

Zi =( xi -10 )/ (1 分),并列在计算表

1:

表 1

正态区间

样本数据

x

i

标准化值

Z

i

K-S 拟合检验计算表

实际累计频

正态累计概率

离差

(1) (2) (3) (- ∞ ,-3)

[-3, [, [, [, [, [, [, [, [,

(4) (5) (6)=(4)-(5)

- - [,∞)

Dn=( 5 分),由于检验统计量小于临界值,所以无法拒绝零

K-S 拟合检验统计量取最大的绝对离差

假设,即可以说该车间生产的轴直径服从均值为

(2)卡方正态拟合检验见表

10,标准差为的正态分布( 卡方拟合检验计算表

预期频数Е

i

2 分)。

2:

样本数据

标准化值

Z

i

表 2

小预期频 数合并 (6)

实际频数

O

i

i

(O- Е

i

x (1)

i

正态区间

正态概率 (4)

=(4) × 10

) /

2

Е

i

(2)

(3) (- ∞ ,-3)

[-3, [, [, [, [, [, [, [, [,

(5)

(7)

(8)

5

2

1 1 1 10

- 合计

- -

[, ∞) -

由于存在小预期频数,所以要合并,直到预期频数都大于 频数(该步正确 2 分)。

从表 2 得卡方检验统计量

1(见第( 6)列),同时计算合并后的实际

Q=( 6 分),自由度 df=k-1=5-1=4 ( 2 分),查卡方分布表得 a=的临界值 C=

Q落在肯定域,不能拒绝零假设,即可以说该车间生产 2 分)。

(左尾),右尾临界值( 2 分),说明检验统计量 的轴直径服从均值为 10,标准差为的正态分布( 第九章 p184-186 1、美国在

1995 年因几种违法而被捕的人数按照性别为:

表 1

男 13927 116741 328476 236495 704565 119175 11413

性别 谋杀 抢劫 恶性攻击

偷盗 非法侵占

纵火

女 1457 12068 70938 29866 18058 2156

351580

偷盗机动车

从这些罪行的组合看来,是否与性别无关如果只考虑谋杀与抢劫罪,结论是否一样( 解:本题适合用独立性卡方检验。

20 分)

建立假设组 H0:犯罪类型与性别无关

H1:犯罪类型与性别有关

r=7,c=2. 自由度 df=(7-1)(2-1)=6

2

Eij =ni. 。 n

计算结果见下表:

(Qij-Eij)^2/Ei

Ei2

j

男 (Qi1)

13927 116741 328476 236495 704565 119175 11413

女(Qi2)

1457 12068 70938 29866 351580 18058 2156

合计 Ei1

15384

谋杀 抢劫 恶性攻击 偷盗 非法侵占 偷盗机动车 纵火 合计

128809 399414 266361 1056145 137233 13569

303146

X^2=

1530792 486123 2016915

由于 X2=>X2 ,6) =,所以拒绝零假设,说明罪行与性别有关。

如果只考虑谋杀与抢劫,则

(Qij-Eij)^2/E

男(Qi1)

谋杀 抢劫 合计

女 (Qi2)

合计

Ei1

Ei2 ij

13927

116741 130668

1457 15384

116727

X^2=

12068 13525

128809

144193

由于X 2=(20 分)

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- sarr.cn 版权所有

违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务