122708085人数成绩 x平均成绩=(70+80+85)/3 ?平均成绩=所有人的成绩总和/总人数 =(70+80*2+85*2)/5=80 权数(权重) (Weighted)是分布数列中的频数或频率。对平均数有权衡轻重(影响)作用权数的两种形式——绝对数(次数)f; ——相对数(比重)当权数是绝对数(次数)f时,加权算术平均数的计算公式为:计算算术平均数 850合 计 70100380150100 10 11 12 13 14 工人人数(人)工人日产量(件)计算算术平均数 9710800合 计7001100456019501400 70100380150100 10 11 12 13 14 工人人数(人)工人日产量(件)不符合基本公式,不是5个工人,而是800个工人;工人人总产量不是60件,而是9710件 错误的计算:加权平均数(件)当权数是相对数(比重) 时,加权算术平均数的计算公式为:计算算术平均数 100.00合 计 8.75 12.50 47.50 18.75 12.50 10 11 12 13 14工人人数比重(%)工人日产量(件)计算算术平均数 12.1375100.00合 计 8.75 12.50
47.50 18.75 12.50 10 11 12 13 14工人人数比重(%)工人日产量(件)1.752.43755.71.3750.875次数和比重这两种权数形式哪种更直接体现权数的实质?例(1) (2)(3)X456合计频数频率(%)10201025.050.025.040100.0X456合计频数频率(%)20402025.050.025.080100.0X456合计频数频率(%)20101050.025.025.040100.0 =5 =5 =4.75 次数是如何影响平均数的?例(1) (2)(3)X456合计频数频率
(%)10201025.050.025.040100.0X456合计频数频率(%)10102025.025.050.040100.0X456合计频数频率
(%)20101050.025.025.040100.0 =5 =5.25 =4.75 比重权数更能够直接体现权数的实质:100 505合计10 2020人数f2人数比重F3人数f 110 4050122708085成绩 x 组距数列如何计算算术平均
数? xfx54合计 2151915 360以下
60—7070—8080—9090—100学生人数(人)f按成绩分组(分)407011097514251275285xf5565758595x54合计
2151915 360以下60—7070—8080—9090—100学生人数(人)f按成绩分组(分)
407011097514251275285xf5565758595x54合计
2151915 360以下60—7070—8080—9090—100学生人数(人)f按成绩分组(分)根据组距数列计算总平均数的方法 ——加权算术平均(分)X——各组的组中值(代表组平均水平)假定条件:组内均匀分布或对称分布一般地,计算结果是近似值。月工资组中值职工人数 500以下
450208 93600500-600550314 172700600-700650382 248300700-800750456 342000800-900850305
259250900-1000950237 2251501000-1100105078 819001100以上115020 23000合计------2000 1445900某企业职工按月工资分组 元如果所给资料的权数不是唯一的,如何正确选择权数?如何选择合适的权数企业1999某月份按工人劳动生产率高低分组的有关资料如下,求该企业工人平均劳动生产率解:根据公式 合计 50295 90以上30285 80------9070875
70------80100565 60------70150355 50------60生产工人总数生产班组x按劳动生产率(件/每人)权数?(4) 算术平均数的特点和数学
性质特点: 算术平均数受变量值和变量值出现次数的共同影响; 算术平均数靠近出现次数最多的变量值; 算术平均数受极端变量值的影
响; 数学性质: 变量值与算术平均数的离差和为零。
变量值与算术平均数的离差平方和最小证明:设2、调和平均数(倒数平均数) 常作为加权算术平均数的变形公式使用。仍是总体的标志总量与总体单位总量的对比,仅仅是因为资料的不同,需要将算术平均数变形。 当缺乏分子数据时,采用算术平均数; 当缺乏分母数据时,采用调和平均数。 某供销社分三批收购某种农副产品,其收购单价及各批收购额如下,计算平均收购价格。批次单价(元)收购额
12.40600022.251200032.152150合计——201509710合计 70011004560195014001011121314工人日总产量(件) m工人日产量(件) x3、几何平均数 例 某企业生产某种产品要经过三道工序,各工序的合格品率分别为95%、96%和98%。 该产品三道工序的平均合格品率为多少?三道工序的平均合格品率为96.32%. 思考:三道工序的废品率分别为5%,4%和2%,则平均废品率为多少?平均废品率=1 - 平均合格率 几何平均数通常用在总量等于各分量乘积的情形。比如,求某些平均比率,平均发展速度等。例1 某流水生产线有前后衔接的五道工序。某日各工序产品的不合格率分别为5%、8%、10%、15% 、 20%,整个流水线产品合格率?例2 某金融机够以复利?绞郊葡ⅰ=?2年来的年利率有4年为3%、 2年为5% 、 2年为8%、3年为10%、 1年为15%。则12年的平均年利率? 平均年利率
=106.82%-100%=6.82%4、中位数(Median) 中位数是根据变量值的位置
来确定的平均数。将变量值按大小顺序排序,处于中间位置的变量值(或数据)即中位数,用表示。由于中位数是位置代表值,所以不会受极端值的影响,具有较高的稳健性。 Me50%50%中位数位置的确定未分组数据:组距数列数据:中位数位置?? N2中位数位置=未分组数据的中位数原始数据: 24 22 21 26 20排 序: 20 21 22 24 26位 置: 1 2 3 4 5位
置??????n+125+123中位数??22??原始数据: 10 5 9 12 6 8排 序: 5 6 8 9 10 12位 置: 1 2 3 4 5 6位置
????n+126+123.5中位数????8 + 928.5??单项变量分配数列的中位数确定 2000年某地区家庭按儿童数分组表
100979075555向上累计100合计
357415320250150 家庭数家庭儿童数 在组距数列中确定中位数: 确定中位数的位置k=N/2和所在组; 计算向上累计次数;用公式确定中位数 其中为中位数组的下限;为总次数;为中位数组前一组的向上累计次数;为中位数组的次数;为中位数组的组距。该公式假定中位数组的频数在该组内均匀分布217365154向上累计54合计 2151915 360以下60—7070—8080—9090—100学生人数(人)按成绩分组(分)某公司职工按月工资分组月工资职工人数(人)
向上累计次数(人)500以下208208500-600314 522600-700382 904700-800456 1360800-900305 1665900-1000237
19021000-110078 19801100以上20 2000合计2000 — 中位数具有不受极端变量值的影响的特点,比算术平均数稳健。 5、 众数(Mode) 众数是指总体中出现次数最多或频率最大的变量值(数据),用 Mo 表示。 众数也是一种位置平均数,且也不受极端值的影响。 集中趋势的测度值之一出现次数最多的变量值不受极端值的影响可能没有众数或有几个众数单项变量分配数列的众数确定 2000年某地区家庭按儿童数分组表100合计357415320250150 家庭数家庭儿童数组距数列的众数——
——众数的值与相邻
两组频数的分布有关 该公式假定众数组的频数在众数组内均匀分布Mo相邻两组的频数相等时,众数组的组中值即为众数相邻两组的频数不相等时,众数采用下列近似公式计算:MoMo等距数列近似计算众数——先确定众数所在组,然后确定众数。54合计 2151915 360以下
60—7070—8080—9090—100学生人数(人)按成绩分组(分)中位数、众数和平均数的关系: 中位数、众数和平均数之间的数量关系决定于总体内次数分配的状况。对称钟形分布情形下: 非对称左偏分布情形下:非对称右偏分布情形下: 实例一:据某报刊报道,某地的一个村庄近几年来经济发展速度很快,全村106户农民家庭2000年户均年现金收入已
经达到25000元左右,这对该地区来说是一个很高的收入水平。可是实地调查却发现,这个村106户家庭中,绝大多数家庭的年现金收入在3000—5000元之间,与周围的村庄并无多大的差别。但是,这个村里却有一户家庭,由于近几年来做收购生皮毛的生意,买卖十分兴隆,年均收入达到200万元以上。正因为如此,村干部在计算全村家庭收入时,户均现金收入一下子就达到了25000元左右。然而,不仅村里绝大多数村民对这种说法持否定态度,认为不能代表他们真实的收入水平,就连那户致富的村民也不以为然。慎用和善用统计平均指标梁秋生(摘自《统计与决策》2003.7)某车间有两个生产小组,某周5天的产量如下: 甲:171,172,172,172,173(件) 乙:220,190,170,150,130(件)你从这两组数据能看不出什么? 某车间有两个生产小组,某周5天的产量如下: 甲:171,172,172,172,173(件) 乙:220,190,170,150,130(件) 两组的平均日产量均为172件。 平均日产量172件的代表性甲组比乙组好,为什么?前面已学过总量指标、相对指标和平均指标,借助这些指标,我们对现象总体的规模、结构、比例和一般水平等有了认识。但这些指标不能反映总体各单位的差异情况,相反地它们却把各单位的差异抽象化,把各单位的差异给掩盖,为了说明总体中各单位标志之间的差异和分布变异情况我们又引进一个指标------变异指标---说明
总体数量特征的另一个指标---------变异指标。 集中趋势(Central tendency) ——平均指标一组数据向其中心值靠拢的倾向和程度测度集中趋势就是寻找数据一般水平的代表值或中心值不同类型的数据用不同的集中趋势测度值选用哪一个测度值来反映数据的集中趋势,要根据所掌握的数据的类型来确定离中趋势(差异程度)——变异指标
因篇幅问题不能全部显示,请点此查看更多更全内容