本帖最后由 首经贸 于 2020-11-23 16:15 编辑
各位同学大家好,然后我来讲讲解一下今天的重点就是我们考研当中的高频考点方差分析和回归分析这两个主要的考点,因为它主要是以计算题的形式来进行考察,所以我来重点讲解一下。
然后现在我们今天会分成方差分析和回归分析两部分,然后我们现在来先看一下方差分析这一部分,我们来先看一下方差分析当中的一些最基本的概念,也就是说他可能会在名词解释当中会出现的一些名词,然后我先来给大家解释一下方差分析是什么。
首先来看方差分析它就是通过检验各总体的均值是否相等,来判断非类型的自变量对于数值型一变量是否有显著的影响。其实方差分析也可以说它是在假设检验当中是进行了一个多总体的假设检验,因为它和假设检验的步骤基本上也是差不多的,只不过它的自变量是分类型的,然后它的因变量是数值型的。然后在方差分析当中我们可能还会问到你因素或者是因子它是什么意思因素和因子,在方差分析当中也就是我们所要检验的对象,然后也会问到他的水平或者说叫处理,这个概念也就是我们因素的一个不同表现,就是因素的水平,也就是它分成了几几类,就是这样子的。
然后第二部分就是我们方差分析的一个基本假定,方差分析的基本假定是我们在考试当中经常会遇到的一个简答题,然后简答题的话就是希望大家能够重点的记住,然后方差分析的基本假定一共有三条,然后第一条就是说我们每一个总体都应该服从正态分布,这一点大多数情况下它都是能够满足的。然后每个总体的方差必须相同,其实本来是我们需要检验的,但是一般情况下题目当中如果想要考你计算题的话,它也能够保证这一个条件。然后第三条的话要保证每个总体的观测值是独立的,这个就是我们方差分析的三条基本假定,然后希望大家能够记住,因为他在简答题当中经常会考察得到。
然后我们再来看一下方差分析的一个基本原理,这一个的话它也是会通过简答题来进行考察,方差分析的基本原理就是内容比较多,但是也是希望大家能够记住的。
然后我们先来看一下他是怎么说的。方差分析是通过检验各总体的均值是否相等来判断分类型自变量对数值型因变量是否显著影响,其实这一句话也就是方差分析的一个定义。再往下这个是我们的定义,有给大家写着,背的时候也不会很费劲。然后下边的话第二句话他是说在方差分析当中数据的误差是通过平方和来表示的,所以总的平方和就可以分解为组间平方和组内平方和,也就是我们经常会在方差分析当中看到常用的一个计算公式,就是总的平方和SST它是等于组间平方和 s s a加上组内平方和SSe计算公式的这句话,它想表达的就是这个意思。
然后我们来看第三句话,他是说组内误差只包含随机误差,而组间误差它又既包含随机误差,又包含系统误差,组内误差的话就是SSe所以它肯定是指含有随机误差的,然后组间误差的话,它既会有随机误差,又会有系统误差。前三句的话都是在解释一些概念,其实然后后边的话才是一个重点需要大家去理解的,就是说如果组间误差它只含有随机误差而没有系统误差的时候,这个时候组间误差与组内误差经过平均后的数值就会非常的接近,他们的比值将会非常的接近于一,如果组间误差除了包含随机误差之外,它还有系统误差的时候,这个时候它们的比值肯定就会变大,因为你的组间误差是包含了随机误,是包含了系统误差的,所以在组间误差经过平均后的数值会大于组内误差,经过平均后的数值,它们的比值就会大于一,当比值大到某一种程度的时候,你就可以说因素的不同水平之间存在着显著性的差异。
也就是说我们的自变量对因变量有了一定的影响。这句话这一段就是有些长,但是大家也是需要尽量的要去背过的,因为它在简答题当中也是很有可能会考到的。
然后接下来就是我们方差分析的一个分类,按照因素的个数的话,我们是可以分成单因素和双因素的单因素和上因素,它的区别其实就是当方差分析当中只涉及到一个分类型的自变量的时候,它就称为单因素的。而你要是涉及到这是设计涉及到两个及以上的话,它就会变成了双只涉及到两个的时候它就会成为双因素的一个方差分析,在双因素方差分析当中也就是说它有两个变量都会对外有影响的话,如果这两个因素是独立的话,我们就可以认为它是没有交互作用的。
但是也有可能他会有一个 a交、b也就是说ab两个因素,它同时作用的话,对b对外也能够产生影响的话,那就称为交互作用,也就是我给大家列出来的交互作用的那个定义,如果两个因素搭配在一起,然后它对因变量产生了一种新的效应,那就称为有交互作用,所以说在双因素方差分析当中我们又分为了有交互作用的方差分析,还有一个无交互作用的是方差分析然后我们方差分析的基本步骤就是下面这三条其实和假设检验差不多,只不过我们在提出假设的时候,这里就可以有多个变量。
也就是说H0的话,它就可以是缪一等于缪二一致=到MIUI I L取值就是可以任意取, h一的话,他们其中当中有不相等的,或者说他们整个都是不相等的,或者说是不全相等的,就是它的一个备择假设,然后他原假设的话它的一个含义的话就是说它的自变量的取值是对因变量没有显著影响的, r h一它就表示不同的自变量的水平。对于因变量是有显著性影响的,所以他们各自的含义大家也要记住,有时候它会让你写出来它们各自的含义是什么。
然后在第二步也是同样要构造一个统计量,我们在方差分析当中用到的统计量就是f统计量,它是等于MSA比上MSe的就是统统计量的计算,大家是一定要记住的。因为他在方差分析当中可能会给出你一个空,让你去填这个值应该怎么做。然后第三步就是要做出统计决策了,统计决策的话,我们可以通过 f值与临界值的比较,也可以通过p值来比较,但一般情况下我们通常是会直接去看它相应的p值是否是大于0.05的或者是大于0.01的等等。
然后这就是我们一个分析的步骤。接下来我就给大家举了一个经典的例题,来帮助大家对于方差分析进行一个理解。我们先来看一下这个题,这个题是说某市教委教材委员会设计了4本不同的小学教材,然后为了比较其教学效果,按随机区组实验原则,将小学分成了城镇一般小学、城镇重点小学和乡村小学三个区组,分别在每个区组当中随机抽取了4所小学,他们被随机的指派一种教材,经一年教学实验后,通过统一的考试得到了各个学校的平均成绩,然后进行方差分析,下面就是我们得到的一个结果表。
然后第一问它会让你根据已知的资料填出上述表中空白格的数字,会让你填,每个格应该填什么?考察方式的话是我们经常会考察到的,无论是在方差分析还是在回归分析当中都是很容易考察到的,所以大家一定要把它每一个空是怎么计算的,是怎么来的,或者说他们各个控之间有什么样的关系,大家也要记住。
然后第二问他就是在问你检验小学类型对教学效果的影响是否显著,让你写出原假设和备择假设,说明分析结果及理由。然后第三个是让你检验不同教材对教学的影响是否显着写出原假设和备择假设。然后第四问他是说检验当中他没有考虑到交互作用,问你他是不是能够进行有交互作用的方差分析呢?这就是我们经常会考察到的四问。两也就是三个类型,第一个类型会让你给你空白纸让你去填。
然后第二个涉及到检验的问题,原假设被子假设应该怎么写,然后以及最后的检验结果应该怎么去分?分析。然后第四问的话就是在双因素当中,他可能就会去问你,我这个没有进行交互作用,我是不是应该进行一个交互作用?
之类的这些问题就是三大类,也就是比较常见,然后现在我们来看一下这分别怎么去解答。然后第一问的话它是让你去填空白格,然后我们先来看一下第一列,第一列的话它就是表示一个平方和的意思,所以说根据我们前面所用到的计算公式,SST等于加上SSe它对于双因素方差分析来说也是实用的,所以他现在给出了你的总的还有随机误差的以及因素a的平方和我们就可以根据这个公式来计算出教材所对应的平方和是什么,就直接用23.08-13.68,然后再减去6.58就可以得出来这个值。
然后自由度的话,它的自由度因素的自由度,它通常就会是你种类去-1,也就是你的水平数去减1k-1。小学类型的话它是分成了三个,所以说它k-1的话它就是等于3。我先清平一下,它的自由度的话,关于因素的话它是等于 k减一,所以说小学类型对应的他有一共有三个小学,三种小学,所以说他就等于2,然后教材的话它是有4本不同的,也就是说它的水平数是4,它的自由度就会是3,然后总的他就等于是 k-1,大大n减一,一共这是12个,有教材14种,小学是三种,3×4就是12,他总的就会是11,然后我们就可以它的自由度也是满足总的是等于分别的自由度之和的,所以说我们就可以算出来这是2~3。
然后这是11 11-5的话,这就是6。我们就可以这样计算,通常来说我是这样计算的,所以比较容易记一些,我通常来说不会去单独的去记忆它随机误差的自由度是什么。
随机误差的自由度其实也就是c减1乘以k减一,就是他们两个的自由度的成绩。但是有时候我怕会寄错,所以通常会按照先看它因素的自由度,然后再去计算它总的自由度,然后再做一个减法,这样会更容易记一些,大家看你们自己怎么方便,记忆就怎么来。然后下面就是要去求军方和军方和的话就很简单,军方和的话,无论是MSA还是MSe的话,它的计算就等于它的 s a比上它的一个自由度就可以计算出来。所以他在这的话就是13.68,然后去÷2,得到一个得到这的值,然后教材对应的 s s除以它的自由度就可以得到一个值,然后随机误差再除以它的自由度,然后就可以得到 m s e就可以得出来最终的结果。
然后f值的计算的话,我们其实也是可以看出就是我们在进行 f计算的时候,它就是由MSA比上 m s e的都没有看完。所以我们就可以来计算出小学类型所对应的这个f值,就可以用你在这计算得到的MS小学的均方值,然后去除以随机误差的均方值,就可以得到一个f值。然后用教材所对应的 MS值去除,以随机误差对应的 m s值就可以得到一个f值。这样的话我们就可以将这个表完成,然后看一下我后边所给出的最终的答案。
我通常来说会以这种表格的方式去呈现,但是大家也可以你把计算公式给它写出来或者是怎么着的,你你可以单独的去写也没问题,我觉得。如果他空的空比较多的话,以表格的方式来呈现也更方便。老师们去判卷,也不会给你判错。因为老师们看的卷子也很多,所以你写的越简单清楚,老师判起来也会更简单一些。
然后看一下二第二问的话就是让你写出检验的步骤,也就是检验的步骤的话,首先是来看检验小学类型对教学效果的影响是否显著。我们写出原假设与被测假设,然后我们在写之前首先要把它设出来,你要设出来你的变量值,就是要先设不同小学类型的学生,他的平均成绩分别为没有一没有二没有三,这样的话它的原假设和备择假设你就可以直接写,原假设h0是用1=02=03的,然后被测假设h1是等于明1米2秒三步相等或者不全相等,然后这一个题它没有让你去解释原假设和备择假设的意思,你如果要去解释的话,它的原假设你就可以显示不同小学类型对于对于教学教学效果来说没有什么显著的影响,贝塔假设的话就是不同的小学类型对教学效果有显著的影响。
大家就可以这样写。然后最终的分析的话,我们可以有表中的p值来看一下,小学类型它的p值是0.034258,然后它肯定是小于0.05的。所以95%的情况下,我们就有理由认为它不同的小学类型对教学的效果是有显著性影响的。
我们再来看一下第三问,第三问的话也是同样的方法,就是你要先把它设出来,然后再去看原假设,预备的假设分别怎么写,然后就可以大家先可以先自己写一下,然后再和我上面给大家的答案来对一下。在这里也是同样的方法,就是你要首先射出来你的他的没有1米2名364,你不能直接网上就直接开始写它的原假设和备择假设分别是什么,你先设出来之后然后再去写,就可以。然后同样的我们再去看他,对于教学效果是否有显著性的影响的时候,我们就可以直接去看他的p值,然后在这儿我们就可以发现他的 p值是大于的,所以我们就可以认为它是没有显著性影响的。
然后我们来看一下第四问,第四问的话他是问你现在用所给出来的数据能不能去做显著性的不是做交互作用的方差分析,其实做方在双因素方差分析当中能够做交互作用的话,首先的前提就是你得满足你这两个因素,它单独的情况下,有没有通过显著性的检验,如果他能够分别通都通过了显著性的检验的话,我们就可以去做一下交互作用,如果其中有一个没有通过,只要有一个没有通过的话,我们一般情况下是不可以进行交互作用的。所以我们通过23的也判断出来,教材的话它是没有通过显著性检验的,所以说我们就可以以这个理由去说,因为教材没有通过显著性检验,只有当教材和学校都通过显著性检验的时候,才能够进行交互作用的方差分析,以这个理由去写去说明这个问题就可以了。
然后这一部分就是关于方差分析我们经常会在计算机当中遇到的一些问题和考察方式和一些基本的概念。关于这一部分的话,可以看一下有没有什么问题,如果有问题的话,可以在聊天区当中打一下,如果没有问题的话,我们就先来看一下第二部分。
然后第二部分的话就是关于相关和回归分析,也就是对应的回归分析那一章。 然后在介绍之前,我们也是要先说一些基本的概念,在相关和回归分析当中这少打了两个回归分析。然后相关与回归分析的一些基本概念的话,首先它可能会问你相关关系是什么,这些都可能会以名词解释的方式来进行出现,所以我就放到了这里。然后相关关系的话,它指的就是存在着一定的联系,但又不是严格的确定的关系,也就是说自变量的每个取值,因变量由于受到随机因素的影响,与其所对应的数值是飞确定的相关关系,其实他说的是不是严格和确定的,意思就是说你没有办法用表达式来把它表达出来,就是说如果你要是有一个y等于kx的话,它像这种有确定性的线性关系相关关系的话,就是他是没有办法用一个表达式来表达出来的。
所以在这里的话大家可以理解一下,第二有了相关关系,你就有评定相关关系的变量,也就是用到了我们的相关系数。相关系数是根据样本数据计算的度量两个变量之间,线性关系强度的统计量,这里一定要看出来是线性关系强度,它的取值是在-1~1之间,如果它的绝对值越趋近于一,就能够说明两个变量之间它的线性关系就会越强,它趋于0的话就说明它们变量之间的线性关系越弱,在这里的话就算他 r的取值等于了0,你也不能说它们之间不存在相关关系,只是不存在线性的相关关系,这一点是要注意一下的。
然后第三个概念就是回归模型,回归模型的话指的就是描述因变量外,它是如何依赖于自变量x和误差相异的方程,就成为了回归模型。在评价回归模型当中,我们经常会用到的一个概念就是拟合优度,然后拟合优度它指的是什么?它指的就是回归直线与各观测点的接近程度,就称为回归直线对数据的拟合优度。
我们来看一下判定系数又是什么?判定系数的话我们经常会说的一个阿尔方,它其实就是说明回归方程对观测数据拟合程度的一个度量值。在判定完模型之后,你可以去做一下预测,做预测的时候它又分成两种情况,一种是平均值的置信区间,平均值的置信区间的话指的就是对于变量给定一个定值x0,你可以求出因变量y的平均值的一个估计区间,你由此得到的区间就称为平均值的置信区间,这个概念虽然没有怎么考过,但是我也是放到了这里,大家可以简单了解一下。
然后第7个的话,个别值的一个预测区间,预测区间的话,对于自变量的一个给定值x0,你可以求出因变量y的一个特别值得一个估计区间,就是平均值的话,你就是去求一下它的平均值,然后个别值的话你就是直接用个别值去加减你的估计误差,就可以得到它的一个估计区间。
这两个就是一个算是相对的概念,可以一块去背。 然后在讲完基本概念之后,我们来看一下线性回归模型,它也有假定条件,假定条件的话也是希望大家能够记住,因为他有时候会在检查题当中考,也有时候不会考,但是他可能会在最后的时候,计算题里边可能也会让你去写,所以尽量去记住线性回归的家庭条件,我们先来看一下一共是有5条,然后第一条的话是针对于被解释变量y和解释变量x之间的他们之间关系的一个假定,就是被解释变量y与解释变量x之间它是具有线性关系的,但是之间不存在高度的线性关系。
说的这好像少了一句话,应该是被解释变量外与解释变量x之间具有线性关系,解释变量x之间不存在高度的线性关系。在这儿就是要加上解释变量x之间。然后第二条假定的话就是解释变量它的取值是非随机的,被解释变量y它是一个随机变量,也就是说解释变量它不是一个随机的变量,但是被解释变量y它是一个随机的变量,这几假定在说谁是随机的?
然后第三个和第4个是针对于随机,第三第四第五都是针对于随机性而言的,然后它的随机误差是一个服从正态分布的随机变量,并且它的期望为0。我这标志出了它就是在说明随机误差项的一个正态性。然后第四第4条的话就是在说对于任何一组特定的 x的取值,你好像老师这个公式大打不上,特定的x1x2一直到XP的取值,随机误差向的方差它都是相等的,也就是要满足一个方差奇性。然后对于任何一组特定的x1x2,知道XP它所对应的随机误差项与其它一组对应的随机误差项是不相等的,也就是要满足独立性。
也就是说它的随机误差项你要满足三条,三条假定是正态性、方差、齐性以及独立性,其实这样看的话,这5条假定有一两条是关于解释变量与被解释变量的,然后有三条是关于随机误差项的,就是大家可以分成两部分去记忆,也能够背得更快一些。然后关于相关和回归分析,这里就是我给大家找了两个例题,然后可以作为一个练习。
然后我们先来看一下例题一它例题的一个考察方式,例题一的话就是会说经过调查,他得到了某市居民的收入与支出资料,然后这个是年份,然后一列是收入,一列是支出,然后第一问就是会让你根据居民的收入与支出这两列数据去计算两者满足的回归方程,然后并说明一下回归系数它的含义。
然后第二问的话就是会让你去做一个预测,这个就是一种特别简单的一种考察方式,一般情况下他也不会只有这么两问,大家可以先看一下,然后再拿到这个题的时候,我们应该怎么去做?我们需要先自己去构思一下,回归方程应该怎么去建。首先第一步你要先把它设出来,外一家它是等于贝塔0一家加上贝塔 e1+x因为它是一个只有一个一元的它是一元线性回归,所以我们就要把它设成这样,首先也是要先设,然后再去姐最终得到我们的一个模型,这个解的话其实就是要去解贝塔01家和贝塔一1家应该怎么去解?
我们要记住它的一个计算公式。然后我们来看一下他的答案是怎么给出的。首先也是要先设回归方程,你所估计的回归方程为y1+2加上贝塔01+2加上贝塔11+2,一家你要写出来,不要只写个贝y等于贝塔0加上贝塔1x这样写是不对的,是可以给你扣分了。就是说有最小二乘法可以知道系数的一个计算公式,贝塔一是等于这个计算公式的,就是公式有点有些长,多写写也能够记住。
然后贝塔0的话它是等于y18减去贝塔1+×x18的,你要是写这样写麻烦的话,你也可以直接写成lxy然后比上lxx这样写也没错,但是它lxy的计算公式是什么?Lx x x的计算公式是什么?你同样也要给人家写上来,所以就不如直接把它最终的一个化简形式写在这,更方便一些。我们就可以带入数据去进行计算。在这一步之前,大家可以先列一下你的外一把是如何计算得到的,然后x也罢,是如何计算得到的,这样的话会使这个步骤更加的完善一些。
就是把外一拔的计算公式也摆,然后x一拔的计算公式也摆,然后最后再说带入数据计算可以得到北塔林一家等于什么?不是贝塔11加等于什么?贝塔01+2=什么?然后我们在计算完之后,就可以说收入对支出的一个预测方程是什么?在到这里我们才是完成了一个回归方程建立的过程。首先要设出来,然后再去解他的系数估计的贝塔01家和贝塔一一家如何去计算,然后最终我们要带入数据去计算,就是分成这三步,然后得到一个预测方程。第一一问的,他就会让你去说明回归系数的一个含义。
回归系数的含义的解释的话是只要考到回归分析,它都会进行考察的一个点。然后回归系数贝塔011减,贝塔一一家,它就表示的是你的自变量每增加一个单位,你的因变量它会平均的增加或减少多少个单位。他就是这样说的,就是我说了我说的这句话只比较概括,但对于具体的问题来说,对于咱们这个题来说就是说贝塔11+=0.7的话,它表示的就是居民收入每增加1亿元,你的支出平均就会增加0.7亿元。有时候他可能没有这个单位,所以说你就可以直接写每增加一个单位。
然后它的因变量会平均的增加或者减少多少个单位,这样写也是没有问题的。然后贝塔01家的话有时候需要解释,当然有时候如果你变量比较多的话,就可以不进行解释。然后在数学意义上来说,贝塔01+2=0.97,它表示的就是居民收入为0时,支出为0.97亿元,但是在经济意义上它其实是没有实际意义的,就是你根本没有收入,你又怎么去支出,所以按照经济上来说,它是没有任何意义的,但是在数学上面它就表示表示这个意思。在这里需要注意的就是的因变量变化都是一个平均的变化量,就是别少写了平均这两个字。
然后第二问的话就是一个简单的预测,他就会问你当居民收入达到多少,50亿元时预测支出会达到多少?然后这个的话就是一个简单的预测的话,我们就只需要写到x等于50的时候,万1+2是什么?直接带入到我们刚才求出来的预测方程里边,得出来最终的结果就行了。所以当居民收入达到50亿元的时候,预测支出它会达到35.97亿元。这个题目就是一个很常规也很简单的一道题目,就第一问会让你去建立方程,然后去解释回归系数的含义。
然后第二问的话就会让你做一个简单的预测,这两个是大家一一定要掌握住的。然后我们再来看一下例题二,例题二的话他就会说某企业我们先来看一下题目,是某企业为了了解居民收入对其产品销售的影响,收集了过去18年的有关数据,然后得到了两个表,一个是方差分析表,一个是回归系数表。然后他同样第一问也会是让你去让你将方差分析表去补充完整。这也就是我说的只要考到长沙分析,他有这一本就是会让你去补表,然后补表的话,在这里再带着大家做一次。
我们先看第一列,第一列的话SS它表示的就是平方和的意思,同样的它是总的平方和是等于回归平方和与残差平方和之和的,所以回归平方和就可以由sa就可以由总计总平方和去减去残差平方和直接用这个数去减,他就可以得到最终的一个回归平方和然后回归平方和的自由度就是你自变量的个数,自变量个数在这里,这里的话就会是一元的话,它就是一然后它的残差残差的自由度,就可以通过总的自由度去减去回归的自由度,因为总的总的自由度它一共是18年,就是有18个数据,所以说它的总的自由度会是18-1就是17,然后总的是17,回归是一,那么残差就是17-1,他就可以得到这事。
16。然后 MS就是要去求他的军方和均方和计算公式,就是以分别由它的回归平方和除以它的自由度,就可以得到回归的一个军方和然后残差的话也是有同样的由SSe去除,以它的自由度就可以得到MSe然后总的话他就没有去放,所以说根据你刚才求出来的回归去除以一得出 MS,然后根据残差的数值去求除以它的自由度,就可以得到残差对应的MS,然后f值的话它的计算公式也是相同的,它是由回归的军方和属于残差的军方和得到的,然后也就是由你计算得到这两个数值,去相处就可以得到我们的f值。
所以说这个表当中它每一个数值是如何计算,如何得来的,就是这么个关系,大家是一定要记住的。然后我们来看一下他给出来的答案,就是我在这里呈现的答案也是用了一个表的方式来进行呈现,大家也可以你单独的去写,但是你要单独去写的话,你就要去写你的回归平回归的平方和是如何计算的,你就需要把关系给他写上,然后你就说总的平方和是由回归平方和与长沙平方和之和所得到的,所以回归平方和的计算计算公式为什么?然后代入数据得什么?
就这样去写就可以。然后它的自由度是一,残差的自由度是16,然后用它除以它就可以得到这个值,然后要把他们的关系要写的明白一点,你是如何计算的,写的细一点就行,如果嫌麻烦的话,就直接用这个表的方式来呈现。然后我们来看一下第二问,第二问的话,他就是问你销售量的总变差当中有多少是因为居民收入的变动所引起的。其实这个就是在变相的考察你阿尔方是如何计算的,因为只要你看到说有多少是因为自变量的变动所引起的话,它一定是让你在求阿尔法。
第二问的话它是用这样的方式让你去求阿尔法,但是有时候他可能会直接问你他的判定系数阿尔法是是什么?然后它的含义是什么?其实这个也就是阿房的一个它的一个含义。 然后r方的计算公式的话就是它是等于SSr比上SST的就是判定系数阿尔法的计算公式,大家是也是要一定记住的,然后在得到这个之后,SSr和SST我们刚才的第一问不是求出来了吗?你就可以直接带进去,然后就可以得到。所以销售量的总变差当中有百分之多少是由居民的变动所引起的。他如果直接在第二问,如果问你判定系数阿尔法如何计算它们的含义是什么的话,大家也要会写。判定系数r方它的含义指的就是在因变量的总变差当中,有百分之多少是因为自变量的变动所引起的,其实他也就是给他做了一下解释。
然后我们来看一下第三问,第三问的话是让你写出估计的回归方程,然后去解释回归方程系数的一个实际含义,这也是一个经常会考察的一个题目。 然后我们就来看一下它的回归方程,这样的话我们就需要去看它的回归系数表的话,它的第一列第一列它表示的就是这个是常数项,然后这个是x value,宝马这个就是指的就是你的自变量x然后这儿就是它分别对应的值,这个是常数值,然后这个是随便聊。顶贝塔一一间,是多少?是贝塔零一件,然后这个是它们所对应的一个残差,然后这个是所对应的t值,然后这是所对应的p值,然后我们可以直接由回归系数表可以看出它的回归方程是外一间,然后是等于30 3 65.3241加上1.2682,然后x的但是我也是希望大家在写出回归方程之前,你最好还是要设一下,就是说我们估计的回归方程为y1+2=贝塔01间,然后加上一家 x你先设出来,然后再说由回归系数表可知贝塔01+2等于多少,贝塔11+2=多少,所以估计的回归方程为多少,就是这样去写得完整一些。
我这里是直接写了的,但是我还是希望大家能够先说一下,先设出来,然后由回归系数我们就可以得到了它回归方程。然后回归系数的话,通常来说其实你只需要解释贝塔一就行,但是有时候也会去解释一下贝塔零,也没有什么特别的硬性要求,所以大家如果有时间的话就尽量的都写上。然后贝塔一一家的话,它表示的就是当你的居民收入每增加一个单位的时候,销售量平均增加了这么多个单位,在这里直接说一个单位多少个单位是是因为我前面刚才说过的问题,就是因为你并不知道他的单位是什么,具体的单位是什么,也没告诉你它是一元还是多少多少万什么之类的,他并没有说,所以这个时候大家就可以直接用多少个单位多少个单位来进行表示就行了。
然后第四问的话,让你去检验回归系数线性关系的显著性,然后写出对应的原假设已备择假设,并去解释它的检验结果。在这里其实检验回归方程的线性关系的话,也就是要进行f检验,但是由于在一元线性当中,一元的回归线性当中,它的f检验和t检验是一样的,所以说我们也就直接可以通过回归系数表的p值来进行判断,大家要把这句话其实要说一下的,我感觉然后我们来看一下他答案是怎么写的。提出原假设贝塔一是等于0的,原假设是贝塔1=0,贝塔假设是贝塔1不等于0,然后由于f检验的p值为0,其实这句话前面应该加上是在一元线性回归当中,由于f检验与 t检验是相同的,所以我们有回归系数的这个表可以看出t检验的p值,其实f检验的p值你在它的表里边是看不出来的,因为他给的都是t值,所以我觉得他给的答案并不是很好,所以大家就是要在这儿写上我刚才说的那句话,在医院线性回归当中, f检验与t检验是相同的。
根据回归系数表可以看出t检验的p值为0.00,然后是小于阿尔法等于0.05的,所以可以拒绝原假设,也就是说我们有理由去认为回归方程的线性关系是显着地,这样写一下就会更加的完善。然后这个就是相关和回归的一些例题,然后我给出的例题大多数都是一元线性回归的,其实在考试的时候它也会考到你多元线性回归,但是多元线性回归和一元线性回归其实都是一样的,只不过是在回归系数的解释的时候就会有一定的偏差。在进行回归系数解释的时候,多元线性回归它会说明是在哪个变量不变的情况下,另一个变量增加一个单位,然后它的因变量会平均变化多少?
大家可以在书上找一个例题去看一下,他都有写。然后我现在给大家找一下,看看动员线性回归这里还有没有什么需要解释的东西? 关于线性回向相关和回归分析这一块,大家还有没有什么问题?如果有问题的话可以说一下,其实这一部分应该还会涉及到一个列连表的分析,但是我在 PPT上没有显示出来,我可以和大家说一下,就是列联表分析他其实也是类似的,只不过他可能会让你去计算一个他的一个起那叫什么?期望值的一个计算的问题。期望值的计算就是如果你要算,他如果给了你一个列联表,让你去算这个位置的它的期望值的话,那就是需要用这样他元素所在的行,然后去成他所在的列他的值,然后再去除以最终它总的值。
来得到他的一个期望值。李连表这儿也一般情况下他也就只会考你一个独立性的一个判断。别的问题也不怎么会考。然后独立性判断这儿也就是会涉及到一个期望值的计算这个问题,然后期望值的计算的话,就是大家去多做一些题目,或者是看看书也都是能够做出来的。
然后关于这一部分的话应该就没有什么要讲的了。关于回归分析这一块的话,他可能也会和后边的时间时间序列那一块去联系,也就是说在时间序列那一块的话,它除了会考名词解释之外,可能会考你一个线性线性回归的一个计算其实也是一样的,只不过这个时候它的自变量就变成了时间t然后具体的计算方法和最终的一个判断都是一样的,是因为我这一部分主要是重点讲我们计算题当中经常会考察的一些问题,所以对于时间序列这一块我也没有过多的去解释。
对于列联表这一块也没有去写很多东西。所以如果关于这一部分有问题的话,也可以现在问我关于列联表这一块就是它的一个独立性检验的卡方值的计算,卡方值是如何计算的?大家也要去记一下,因为他有可能会让你去算,然后会关于列联表分析这一块,它可能会让你去算期望值,期望频数是什么?你要会算卡方值是什么?如何去计算?它的计算公式你要背过,然后它各自的自由度怎么去计算你也要知道。关于电压表分析也就这一块。
然后关于时间序列分析的话,也就是你需要知道它的那一些概念,然后还有就是书上的计算题能够做出来就行。 重点的话,看看他的一个名词解释,我觉得时间序列的计算题,它最多也就是和考上这种线性回归的东西,别的的话应该就没有什么了。相关测量需要相关测量是什么?我没有太理解你相关测量是什么意思,你可以说一下相关测量是啥意思。相关测量是相关分析那里的吗?
那个应该是不需要的力量分析当中,它主要也不会考的你特别细。那么它的列表分析,我做过的题目,它基本上都是考察你期望评述什么之类的,这些会多一些。应该是不会考的,因为我们主要其实还是要以马丽萍老师的那本书为主的。贾老师这本书你作为一个补充去看就行。贾老师的那本书里边,你主要看他的列联分析独立性检验就行列联表中的相关测量应该是没有考过。没关系没事。
还有什么别的问题吗?关于我上面说到的一些或者是你们在做题当中遇到的一些问题,你说的相关测量的话,它会以名词解释考的方式更多一些,但是也一般情况下,我感觉可能考的几率也不是特别大,但是还是需要备一下的。最后的综合题就是调查问卷,调查问卷的话其实按照去年来说的话,我感觉就是他的重点,也就是虽然也是在设计问卷,但是它在涉及具体问题之前,他会问了你很多其他的问题,就是关于问卷的叫什么调查方式,也会有问。所以我感觉他有一点想把分值分开的那种意思,不会直接后边直接给你一道大题,让你去设计问卷。
但是关于设计问卷这个问题的话,我觉得你也就只能在做真题的时候,尽量的先自己去写,然后再去和答案,对。我感觉是一种比较好的方式,要不然的话你直接去看答案,你会感觉这问卷设计的问题设计的比较好,但是你在考场上可能就自己让自己设计的话就会设计不出不出来。有一些问卷当中的基本问题,你可以写上的就是关于什么,你可以第一道题问你的性别。 然后第二道题就是年龄。然后第三道题就是职业这样子的,这三道基本上就是一个很基本的问题,就是你都可以写在这儿,而且问卷调查的话说实话他问卷的问题的个数,一般你能控就写出12个左右。差不多。
但是具体的问题要设计什么样的问卷的话,其实感觉确实不太好做,但是你也要尽量的去往你想要调查的需求这方面去靠拢,也只能是这样说,你尽量的可以去问卷星或者什么的,你上去去看看他们那些问题,在网上找找一些。我感觉他每次让整的问题都比较挺宏观的。可以去网上先搜一搜,你觉得那种比较好的话题什么的,然后先去看看人家是怎么写的。然后你可能会对你一些问卷调查的问题会有一点帮助,我觉得。是因为我当时也没有特别的去练这一部分,所以可能也给不了你特别好的建议。
比如说你在20的真题,我不知道你们有没有做20的真题,就是20的真题的话,它就是在调查居民对对于政府服务这一块,他的满意度这种的满意度的话,你就是这道这一道题我感觉最主要的就是你能够找到哪些部分它是属于政府的公共服务的,你能够把它分成多少个部分,你就有多少个问题。其实就是对于这种什么满意度需求度,他一般都会是这种这样的问题,所以你可以去网上一找一些这种关于满意度需求度什么之类的这些问题,去看看他们的问卷是怎么写的,然后我觉得是有一定帮助的。
最后的问卷确实是挺难啃的,就看你们的时间,尽量的都自己做问卷,不要一上来就看答案,我感觉应该会好一点。而且现在的最后一道题,他也没有直接上来就让你设计问卷就会问你一些其他的问题,然后把分值分散一些。
所以放宽心别太紧张就行,就写出几个基本问题,然后再写出几个相关问题来,尽量的去写就行了。然后还有其他的什么问题吗?如果没有的话,咱们今天这个直播课就到这儿了。关掉直播了。如果大家没有问题的话。
|