首经贸 发表于 2022-9-20 16:36:04

【考研锦囊】702统计学核心知识点分享之导论、数据的收集

学姐介绍
大家好,我是已经上岸的一诺学姐,我考研初试总分400+,702专业135+,916公共管理综合140+,初试复试排名前三,善于归纳总结抓住考试重点难点,为考生提供高效学习秘诀和应试技巧,指导同学们精准、高效有战略的复习。
第一章:导论
一、统计学及其应用领域
1、统计学
是收集、处理、分析、解释数据并从数据中得出结论的科学。
2、数据分析所用方法
描述统计研究的是数据收集、处理、汇总、图表描述、概括与分析等统计方法。推断统计是研究如何利用样本数据来推断总体特征的统计方法。
3、应用领域
企业发展战略、产品质量管理、市场研究、财务分析、经济预测、人力资源管理。
二、统计数据的类型
1、按照计量尺度不同分类
(1)分类数据:只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,是用文字来表述的。
(2)顺序数据:只能归于某一有序类别的非数字型数据。顺序数据虽然也是类别,但这些类别是有序的。
(3)数值型数据:按数字尺度测量的观测值,其结果表现为具体的数值。
2、按照收集方法分类
(1)观测数据:通过调查或观测而收集到的数据,这类数据是在没有对事物人为控制的条件下得到的。
(2)实验数据:在实验中控制实验对象而收集到的数据。
3、按照被描述的现象与时间的关系分类
(1)截面数据:在相同或近似相同的时间点上收集的数据,这类数据通常是在不同的空间上获得的,用于描述现象在某一时刻的变化情况。
(2)时间序列数据:在不同时间收集到的数据,这类数据是按时间顺序收集到的,用于描述现象随时间变化的情况。
三、统计学中的几个基本概念
1、总体
(1)定义:包含研究的全部个体(数据)的集合;组成总体的每个元素称为个体。
(2)分类:
有限总体:总体范围能够明确确定,而且元素的数目是有限可数的。
无限总体:总体所包括的元素是无限的、不可数的。
2、样本
(1)样本是从总体中抽取的一部分元素的集合。
(2)样本量:构成样本的元素的数目成为样本量。
抽样的目的是依据样本提供的信息的总体的特征。
3、参数和统计量
(1)参数
参数是用来描述总体特征的概括性数字度量,它是研究者想要了解的总体的某种特征值。
总体参数主要有总体平均数、总体标准差、总体比例。
(2)统计量
统计量是用来描述样本特征的概括性数字度量。
样本统计量主要有样本平均数、样本标准差、样本比例。
4、变量
(1)变量
说明现象某种特征的概念,其特点是从这一次观察到下一次观察结果会呈现出差别或变化。
(2)变量的类型
①分类变量:说明事物类别的一个名称,其取值是分类数据②顺序变量:说明事物有序类别的一个名称,其取值是顺序数据③数值型变量:说明事物数字特征的一个名称,其取值是数值型数据
第二章:数据的收集
一、数据的来源
1、数据的间接来源
(1)间接来源的数据(二手资料)
如果与研究内容有关的原信息已经存在,只是对这些原信息重新加工、整理,使之成为进行统计分析可以使用的数据。
(2)二手资料的优点
搜集比较容易,采集数据的成本低,并且能很快得到。
(3)二手资料的局限性
相关性不够,口径可能不一致,数据也许不准确,也许过时等。
(4)对二手资料进行评估的内容
①资料是谁搜集的?②为什么目的而搜集?③数据是怎样搜集的?④什么时候搜集的?
使用二手数据,要注意数据的定义、含义、计算口径和计算方法,避免错用、误用、滥用。
在引用二手数据时,应注明数据的来源,以尊重他人的劳动成果。
2、数据的直接来源
(1)调查数据
它是通过调査方法获得的数据;调査数据通常取自有限总体,即总体所包含的个体单位是有限的。
普查:对总体中所有个体单位进行的调査,普查数据具有信息全面、完整的特点,对普查数据的全面分析和深入挖掘是统计分析的重要内容。
(2)实验数据:通过实验观察得到的统计数据
二、调查数据
1、概率抽样
指遵循随机原则进行的抽样,总体中每个单位都有一定的机会被选入样本。
(1)特点
a.抽样时是按一定的概率以随机原则抽取样本。b.每个单位被抽中的概率是已知的,或是可以计算出来的。c.当用样本对总体目标量进行估计时,要考虑到每个样本单位被抽中的概率。
等概率抽样:单位之间被抽中的概率可以相等。
(2)概率抽样的方式
①简单随机抽样
从包括总体N个单位的抽样框中随机地抽取n个单位作为样本,每个单位入样的概率是相等的。
②分层抽样
从不同的层中独立、随机地抽取样本,将各层的样本结合起来,对总体的目标量进行估计。
③整群抽样
将总体中若干个单位合并为组,这样的组称为群。抽样时直接抽取群,然后对中选群中的所有单位全部实施调査。
④系统抽样
将总体中的所有单位(抽样单位)按一定顺序排列,在规定的范围内随机地抽取一个单位作为初始单位,然后按事先规定好的规则确定其他样本单位。
⑤多阶段抽样
采用类似整群抽样的方法,首先抽取群,但并不是调査群内的所有单位,而是再进一步抽样,从选中的群中 抽取出若干个单位进行调査。将这种方法推广,使抽样的段数增多。
2、非概率抽样
(1)定义:抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调査。
(2)类型
①方便抽样
调查过程中由调查员依据方便的原则,自行确定入抽样本的单位。
②判断抽样
研究人员根据经验、判断和对研究对象的了解,有目的地选择一些单位作为样本,实施时根据不同的目的有重点抽样、典型抽样、代表抽样等方式。
③自愿抽样
指被调查者自愿参加,成为样本中的一分子,向调查人员提供有关信息。
④滚雪球抽样
往往使用于对稀少群体的调査中。在滚雪球抽样中,首先选择一组调査单位,对其实施调査之后,再请他们提供另外一些属于研究总体的调查对象,调查人员根据所提供的线索,进行此后的调查。这个过程持续下去,就会形成滚雪球效应。
⑤配额抽样
类似于概率抽样中的分层抽样,它是首先将总体中的所有单位按一定的标志(变量)分为若干类,然后在每个类中采用方便抽样或判断抽样的方式选取样本单位。
3、概率抽样与非概率抽样的比较
(1)非概率抽样适合探索性的研究和市场调查中的概念测试,其特点是操作简便、时效快、成本低,而且对于抽样中的童年国际雪专业技术要求不是很高。
如果调查的目的是用样本的调查结果对总体相应的参数进行估计,并计算估计的误差,得到总体参数的置信区间,就应当使用概率抽样的方法。
(2)概率抽样的技术含量更高,无论抽选样本和调查数据进行分析,都要求有较高的统计学专业知识调查的成本也比非概率抽样的调查成本高。
4、搜集数据的方法
(1)自填式:在没有调查员协助的情况下由被调查者自己填写,完成调查问卷。
(2)面访式:指现场调査中调査员与被调査者面对面,调査员提问、被调査者回答这种调査方式。
(3)电话式:指调查人员通过打电话的方式向被调查者实施调查。
5、数据搜集方法的选择
(1)抽样框中的有关信息(2)目标总体的特征(3)调查问题的内容(4)有形辅助的使用(5)实施调查的资源(6)管理与控制(7)质量要求
三、数据误差
1、抽样误差
(1)定义
由于抽样的随机性引起的样本结果与总体真值之间的误差,是一种随机性误差,只存在于概率抽样中。
(2)影响因素
抽样单位的数目、总体的变异性、抽样方法的选择、抽样组织方式不同。
2、非抽样误差
(1)定义
指抽样误差之外的,由于其他原因引起的样本观察结果与总体真值之间的差异。
(2)类型
①抽样框误差②回答误差(分为:理解误差、记忆误差、有意识误差)③无回答误差(系统性的:预防或补救)④调査员误差⑤测量误差
3、误差的控制
(1)抽样误差是由于抽样的随机性带来的,只要釆用概率抽样,抽样误差就不可避免。
控制抽样误差的主要方法:改变样本量
(2)非抽样误差与抽取样本的随机性无关,因而在概率抽样和非概率抽样中都会存在(但抽样框误差仅在概率抽样中存在)。有很多的原因造成非抽样误差,因此控制起来比较困难。
非抽样误差控制的重要方面是调查过程的质量控制。
包括:调查员的挑选,调查员的培训,督导员的调查专业水平,对调査过程进行控制的具体措施,对调査结果进行检验、评估,对现场调査人员进行奖惩的制度等。
最后给大家留三道例题,大家可以自行练习一下(可以添加下方课程顾问获取题目答案以及解析哦)
https://pic1.zhimg.com/80/v2-36966df4420bae305790223bf1eb7880_720w.jpg
https://pic4.zhimg.com/80/v2-61e4eb6fbf2d0cc3b13e6e4356cfa7c3_720w.jpg
关于702统计学的部分知识点的讲解就先到这里啦
https://pic4.zhimg.com/80/v2-62c069925decd60ea8ab2eba2e84f4cf_720w.png
页: [1]
查看完整版本: 【考研锦囊】702统计学核心知识点分享之导论、数据的收集