授 課 目 錄
第五章 抽樣方法與抽樣分佈
從被研究的母體中,隨機抽取具有代表性的樣本來進行分析,即是抽樣調查。從人力、財力或時間的觀點來看,抽樣調查是比普查有效率。
5.1 抽樣方法
抽樣調查的方法很多,若考慮人力、財力、時間或母體性質等因素,可分為:(1) 簡單隨機抽樣、(2) 分層抽樣、(3) 群落抽樣、(4) 系統抽樣。
係指母體中的任一元素被選中的機率均相同的抽樣方法。常以抽籤方式或亂數表進行。由簡單隨機抽樣法所得的樣本稱之簡單隨機樣本,簡稱隨機樣本。此法可分為抽出放回(每次為1/N)或抽出不放回[1/N,1/(N-1),…,1/(N-n-1)]的抽樣方式。
1 | a%×N | Random Sampling | a%×n |
2 | b%×N | b%×n | |
: | : | : | |
k | [1-(a+b+…k)%]×N | [1-(a+b+…k)%]×n | |
母體(N) | 樣本(n) |
係將母體的元素排列序後,每隔一定時間選取一樣本,直到選滿為止。間隔可以時間或空間為單位。
5.2 抽樣分佈
5.2.1 樣本比例的抽樣分佈
母體的比例p未知,須以抽樣方法來估計。通常從母體抽取n個樣本,觀察其中具有某種屬性的個數為x,並以= x/n表示樣本比例。
為p的估計值,即估計母體中具有某種屬性的比例p。
根據二項分佈,執行n次試驗中,若每次成功發生的機率為p,則隨機變數X的期望值與變異數分別為E[x] = np,Var[x] = np(1-p)。因此可得樣本比例的期望值與變異數:
E[] =E[x/n] =E[x]/n= (np)/n = p (5.1)
Var[] =V[x/n] =V[x]/ n2 = np(1-p)/ n2= p(1-p)/n(5.2)
依極限定理,當n很大時,之抽樣分佈近似常態分佈,即
~N(p, p(1-p)/n)(5.3)
當樣本數n愈大,的變異數愈趨近於零,表示樣本比例
會因樣本愈大而愈接近母體比例p。將
轉為標準常態分佈,即
Z = (-p)/[p(1-p)/n]1/2 ~ N(0, 1)
範例、致遠管理學院學生有10%的比例有體重過重的現象,茲隨機抽取400位該校學生,試問體重過重的比例之期望值與變異數? 又體重過重比例大於12%之機率?
SOL:(a) E[] = p = 0.1
Var[] = p(1-p)/n = 0.1*0.9/400 = 0.000225
(b) P(> 0.12) =
P((-0.1)/(0.000225)1/2 > (0.12-0.1) /(0.000225)1/2)
= P(Z >1.33) = 0.0918
公式、查表、Excel
範例、致遠管理學院學生之統計學檢定,正常下PASS之機率80%,茲200位該校學生進行該課程檢定,試問PASS的比例 (a) 介於0.75~0.85之機率? (b) 大於0.9之機率?
SOL:(a) E[] = p = 0.8
Var[] = p(1-p)/n = 0.8*0.2/200 = 0.0008
P(0.75 < < 0.85) = P(-1.77 < Z<1.77)= 0.9232
(b) P(>0.9) » P(Z >3.5) » 0
公式、查表、Excel
5.2.2 樣本平均值的抽樣分佈
利用樣本平均值來推論母體的的平均值m,藉此了解母體集中趨勢。依極限定理,從任何以期望值m,變異數s2的母體中,隨機抽出n個樣本{x1, x2,…,xn}(當n很大),則樣本平均值
將趨近母體的期望值為m、變異數為s2/n,即為標準常態分佈
(-m)/[s2/n]1/2= Zn ®N(0, 1)(5.4)
即樣本平均值~N(m, s2/n)。
5.2.3 兩樣本平均值的抽樣分佈
通常是應用在『不同母體間某性質差異之比較』,如工管系兩班學生統計學成績的差異。由兩樣本平均值的抽樣分佈,去衡量推論母體平均值差m1 - m2的狀況。
兩母體分別為(m1, s21)、(m2, s22),且兩者的分佈並不一定是常態。倘各自從中取出兩組樣本,因此兩組樣本互為獨立,且®N(m1 , s21/n1),
®N(m2 , s22/n2),故
-
®
Copyright © 2019- sarr.cn 版权所有 赣ICP备2024042794号-1
违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com
本站由北京市万商天勤律师事务所王兴未律师提供法律服务