1 / 83

《 统计学 》 课件

《 统计学 》 课件. 项目四 统计整理 —— 统计分组及统计图表的编制方法. 教学目的与要求 通过本项目学习,首先要明确统计整理的意义和步骤,重点掌握统计分组的理论和方法,学会编制变量数列和统计表。 教学重点与难点 重点 :分组标志的选择; 连续型变量的组距分组;次数分布数列的编制;权数意识的培养,正确理解权数。 难点 :组距分组中组数、组距和组限的确定。. 教学导例 某高校教师有关资料. 1. 女,本科,讲师,月收入 3500 ; 2. 男,本科,副教授,月收入 3800 ;

Download Presentation

《 统计学 》 课件

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 《统计学》课件 项目四统计整理——统计分组及统计图表的编制方法

  2. 教学目的与要求 通过本项目学习,首先要明确统计整理的意义和步骤,重点掌握统计分组的理论和方法,学会编制变量数列和统计表。 教学重点与难点 重点:分组标志的选择; 连续型变量的组距分组;次数分布数列的编制;权数意识的培养,正确理解权数。 难点:组距分组中组数、组距和组限的确定。

  3. 教学导例某高校教师有关资料 1.女,本科,讲师,月收入3500; 2.男,本科,副教授,月收入3800; 3.男,专科,讲师,月收入2600; 4.女,本科,讲师,月收入2800; 5.女,本科,副教授,月收入3900; 6.女,研究生,讲师,月收入3100; 7.男,本科,教授,月收入4200; 8.女,研究生,副教授,月收入3200; 9.女,研究生,教授,月收入4300; 10.女,专科,讲师,月收入2900; 11.女,本科,讲师,月收入3100; 12.女,研究生,讲师,月收入3100; 13.男,本科,教授,月收入4500; 14.男,研究生,教授,月收入3600; 15.女,本科,讲师,月收入3500; 16.男,研究生,副教授,月收入3800; 17.男,专科,讲师,月收入2600; 18.女,本科,讲师,月收入2800; 19.女,本科,副教授,月收入3900;20.女,本科,副教授,月收入3100; 21.男,本科,教授,月收入4200; 22.女,研究生,教授,月收入3500; 23.女,研究生,讲师,月收入3200 24.女,研究生,讲师,月收入3900; 25.女,研究生,教授,月收入4800;26.女,研究生,讲师,月收入3100;

  4. 某高校教师有关资料(续1) 27.男,本科,教授,月收入4500; 28.男,研究生,教授,月收入4700 29.男,研究生,教授,月收入4800;30.女,研究生,讲师,月收入3800 31.女,研究生,讲师,月收入3500;32.男,研究生,副教授,月收入3600 33.男,本科,副教授,月收入4200;34.女,本科,教授,月收入3900 35.男,研究生,讲师,月收入3200;36.女,本科,讲师,月收入3200 37.女,本科,助教,月收入2100; 38.男,本科,副教授,月收入3600; 39.男,专科,讲师,月收入2600; 40.女,本科,教授,月收入4800; 41.女,本科,副教授,月收入3900;42.女,研究生,讲师,月收入3100; 43.男,本科,教授,月收入4500; 44.女,研究生,副教授,月收入3900 45.女,研究生,教授,月收入4200;46.女,专科,助教,月收入2900; 47.女,研究生,讲师,月收入2800;48.女,本科,教授,月收入4900; 49.男,本科,助教,月收入1800; 50.男,研究生,教授,月收入4600; 51.女,本科,助教,月收入1900; 52.男,本科,副教授,月收入3800;

  5. 某高校教师有关资料(续2) 53.男,专科,讲师,月收入2600; 54.女,本科,助教,月收入1800; 55.女,本科,助教,月收入1900; 56.女,本科,副教授,月收入3100; 57.男,本科,教授,月收入4200; 58.女,研究生,副教授,月收入3500 59.女,本科,讲师,月收入2800; 60.女,研究生,副教授,月收入3900 61.女,研究生,教授,月收入4100;62.女,研究生,助教,月收入1800 63.男,本科,助教,月收入1800; 64.男,研究生,助教,月收入1600 65.女,本科,助教,月收入1900; 66.男,本科,副教授,月收入3700 67.男,专科,讲师,月收入2600; 68.女,本科,讲师,月收入2800; 69.女,本科,助教,月收入1600; 70.女,本科,副教授,月收入3100 71.男,本科,教授,月收入4200; 72.女,研究生,教授,月收入4500 73.女,本科,讲师,月收入2800; 74.女,研究生,副教授,月收入4200 75.女,研究生,助教,月收入2100; 76.女,研究生,助教,月收入1800 77.女,本科,助教,月收入1800; 78.女,本科,副教授,月收入3900 79.女,研究生,讲师,月收入3300 80.女,本科,助教,月收入1800

  6. 面对如此繁杂的 个体资料,大家 感觉怎么样? 乱乱乱…….. 那么整理为下面的图表又怎么样呢?

  7. 整理结果的表现形式-统计图该校教师职称及性别柱形图整理结果的表现形式-统计图该校教师职称及性别柱形图

  8. 该校教师职称、性别、学历结构图

  9. 整理结果的表现形式-统计表该校教师职称及性别分布数列单位:人整理结果的表现形式-统计表该校教师职称及性别分布数列单位:人

  10. 某高校教师月收入分布表

  11. 本项目的主要任务 ☆统计整理的意义和步骤 ★统计分组方法 ☆次数分布(分配)数列 ★统计表的绘制

  12. 任务一 理解统计整理的概念地位 了解统计整理的基本步骤

  13. ※ 统计整理的地位 统计调查统计整理统计分析 一、统计整理的意义 ※统计整理的概念 根据目的 对统计调查资料 实施分类、汇总 编制统计图表 为统计分析奠定基础 取得研究结论 对总体的理性认识 搜集原始资料 对个体的感性认识 分类、汇总 过渡阶段

  14. 二、统计整理的步骤 制订整理方案 1 2 审核调查资料 具体实施整理 3 4 复查整理结果 5 4 编制统计图表

  15. 统计整理的步骤(续) ★制订整理方案:主要内容有: 统计分组体系和统计指标体系; 编制整理表格和填表说明; 整理的组织形式和汇总的技术方法。 ★ 审核调查资料:审核内容包括: 调查资料的完整性和正确性。 审核方法:逻辑检查和计算检查。 ★绘制统计图表:统计资料表现形式(参见以下图表例)

  16. 2010年全国不同规模的家庭户类别

  17. “十五”时期我国进出口情况

  18. 任务二 理解统计分组的概念作用 熟知统计分组的基本方法

  19. 一、统计分组的意义 ☆ 统计分组: 根据统计研究的需要,将总体 按一定的标志划分为若干性质 不同的组成部分的统计方法。 ☆ 两个涵义: 对总体而言是“分”, 对个体而言是“合”。 质量标准: 组内同质性 组间差异性

  20. 统计分组的主要作用 对社会经济现象进行类型划分 统计分组过程就是类型划分的过程。划分类型,揭示差异是统计分组的根本作用 。 对社会经济现象进行结构分析 反映总体内部结构,判定现象性质及变化。 研究社会经济现象间的依存关系 分析影响因素和结果之间的变动关系及规律。

  21. 二、统计分组的两个关键问题 (一)选择分组标志(首要问题) ①根据研究目的 选择分组标志 的原则 ②选择主要标志 ③具体问题具体分析 (二)划分各组界限 在选定分组标志后,就需要明确组与组之间的界限。

  22. 如何正确选择分组标志?? 选择主要标志:有时存在若干个标志 都能不同程度满足研究目的的需要。 如研究某高校职工生活水平,可用的 标志有:职工工资、收入、职工家庭月 人均收入、职工家庭年人均收入。 该选择哪个更为合适呢?

  23. 三、统计分组体系 统计分组体系:运用多个分组标志对同 一总体进行分组形成的一系列相互联系、相互补充的统计分组的整体。 平行分组体系:两个及以上标志分别分组 复合分组体系:两个及以上标志层叠分组 简单分组:对总体只按一个标志分组。

  24. 平行分组体系(人口分组为例) 性别 男 女 年龄 0-14 15-64 65以上 户籍 城 乡 平行分组体系适宜对研究对象进行 多角度、多方面分析。

  25. 复合分组体系(人口分组为例) 0-14 15-64 65以上 复合分组体系宜对研究对象 进行 多层次逐层深入分析 男 城镇 0-14 15-64 65以上 女 0-14 15-64 65以上 男 农村 0-14 15-64 65以上 女

  26. 复合分组体系 注意:复合分组每增加一个层次就会使组数几何级增加。如上例: 2——6——18组。因此复合分组层次也不可过多。有时候,为了排版和观感的需要复合分组的表现形式还可以采用上表式样。

  27. 2010年第六次人口普查分性别和年龄的人口复合分组情况2010年第六次人口普查分性别和年龄的人口复合分组情况

  28. 对问题的研究往往需要多角度和多层次。平行分组体系可以满足多角度研究的需要,复合分组体系可以满足多层次研究的需要。对问题的研究往往需要多角度和多层次。平行分组体系可以满足多角度研究的需要,复合分组体系可以满足多层次研究的需要。

  29. 四、统计分组的种类及方法 品质分组 统计分组 单项分组 变量分组 等距分组 组距分组 异距分组

  30. (一) 品质分组(实例)

  31. (二)变量分组 变量分组反映的是各组量的差别,通过量的差别来反映事物间的性质差别。 1.单项分组 每组只用一个具体的变量值来表示的分组。其组数由不重复的变量值个数决定;各组组值明确。适用于不重复的变量值个数不多的离散变量。

  32. 单项分组(实例) 现有50名育龄妇女(15-49)生育子女数情况: 0 2 1 1 3 1 3 0 0 1 1 3 2 0 0 0 3 1 0 0 2 0 2 0 1 1 0 1 1 0 1 1 2 1 3 1 5 3 2 1 2 0 2 3 2 1 0 1 2 0 按育龄妇女生育子女数进行单项分组可分为: 0、1、2、3、5五组。

  33. 2、组距分组 各组用变量值的变动区间来表示。适用于连续变量和不重复的变量值个数很多的离散变量。 (1)几个基本概念: 组限:(下限、上限) 闭口组:下限、上限都有。如200——300 开口组: 下开口组: ××以下 上开口组: ××以上

  34. 为什么要设开口组? 统计分组的原则:“不漏不重” 。即: (1)要使总体中的每个单位都有组可归,贯彻分 组的“穷举”原则;即:“不遗漏”原则。 (2)每个单位都只能归到某一组,不能重复归组; 即“互斥”原则。 在出现极端值情况下,为了遵循统计分组的原则,应设置开口组解决极端值归组问题。

  35. 全距=最大值—最小值 组距=上限—下限 (注意:开口组组距以邻组组距代替)实例: 组距分组(续2) 学生成绩分组 60以下 60-70 70-80 80-90 90以上 年龄 0-14 15-64 65以上 职工工资分组 1000以下 1000-2000 2000-3000 3000-4000 4000以上

  36. 下开口组 ××以下 上开口组 ××以上 组距 下限 上限 组中值

  37. 注 意 组中值代表组内各单位的一般水平。 其代表性受组内各单位分布是否均匀或是否在 组中值两侧成对称分布,否则计算出来的数值 与实际会有较大偏差。

  38. (2)组距分组要解决的几个主要问题 组距:等距分组或异距分组? 组距多长? 实际工作中,一般采用等距分组。 组数 :就是决定将总体分成多少组? 组距和组数必须先确定一个。当研究对象有明显的几个组成部分,则可先确定组数,再根据情况确定各组的组距。 组限:确定组限就是要找出何处是决定事物性质差别的数量界限?组限的表示方法?

  39. 组距和组数的关系 组数与组距的确定,要力求能够将总体分布的特点反映出来。由于全距是既定的,在等距分组情况下,组距和组数存在相互制约的关系: 需要注意:根据上式计算的只能是一个参考数。

  40. 若先确定组距 组距要适中。若组距过小,易将同质单位划分在不同组;若组距过大,会使不同性质的单位同处一组,掩盖现象质的差异。 若先确定组距,应先观察原始资料,大致判断总体的水平高低和分布,然后确定组距。如对某公司职工按月收入分组。据资料若大致判断其收入普遍在3000元左右,此时以500元或1000元做为组距比较合适,若大致为1000元左右,则组距为100元或200元比较合适。

  41. 资料:现有某地区500个企业的计划完成 程度资 料,其中最低83%,最高125%,全距为42%。 ★若先确定组数-----实例讨论 据本资料可确定组数为6,则计算出的组距为7,分组结果为(1)。观察以下三种分组结果:

  42. 先确定组数-----实例讨论 分组结果(1) 83% ----90% 90%---97% 97%---104% 104%--111% 111%---118% 118%---125% 分组结果(2) 83%-----93% 93%-----103% 103%-----113% 113%-----123% 123%-----133% 分组结果(3) 80%----90% 90%----100% 100%----110% 110%----120% 120%----130%

  43. 以上哪种分组效果最好? 首先,分组(1)杂乱,难分析判断。一般等距分组时,组距尽可能取10或10的倍数,此例选10较合适。 其次,分组(1)第三组和分组(2)第二组均出现严重问题,既包括超额完成计划的,还包括没有完成计划的。 再次,组限问题,如确定组距为10,组数为5,而各组具体范围没搞清,分组(2)也不合适。 最后,在算全距时要注意别机械。若有极端值,则以次大或次小值计算全距,再用开口组解决最大或最小值归组问题。 若此例有20%和180%,可以在计算全距时不考虑

  44. 组限的表示方法 组限的表示方式取决于变量的类型。连续变量,须采用重叠组限;离散变量可采用间断组限或重叠组限。如:企业按职工人数分组 不重叠组限 99以下 100 —— 999 1000——4999 5000以上 重叠组限 100以下 100——1000 1000——5000 5000以上

  45. 连续变量组限的表现方法------重叠组限 职工月收入分组 (元) 1500以下 1500-----2000 2000-----2500 2500-----3000 3000-----3500 3500-----4000 4000以上

  46. 组距分组一般采用等距分组; 各组组距以10或10的倍数为宜; 组数不可过多(少),10组以内5-10组为宜; 组限以10或10 的倍数为宜; 采用重叠组限,并遵循“上组限不在内”原则。 根据“穷举”原则要求,最小组的下限要不高于最小变量值; 最大组的上限要不低于最大变量值。 组距分组的一般处理方法 总结

  47. 任务三 了解分配数列的构成 熟知分配数列的编制

More Related