新書推薦:
《
唐朝三百年
》
售價:HK$
107.8
《
反操纵心理学:夺回人生主导权 拒绝被操纵
》
售價:HK$
54.8
《
同工异曲:跨文化阅读的启示(修订版)
》
售價:HK$
43.8
《
牛津立法研究手册
》
售價:HK$
358.6
《
制度为什么重要:政治科学中的新制度主义(人文社科悦读坊)
》
售價:HK$
63.8
《
梦醒子:一位华北乡居者的人生(1857—1942))(第2版)
》
售價:HK$
74.8
《
啊哈!原来如此(中译本修订版)
》
售價:HK$
63.8
《
部分识别入门——计量经济学的创新性方法
》
售價:HK$
75.9
|
編輯推薦: |
本书除了包括经典计量经济学内容,还包括近年来比较新的计量经济学研究成果;除了介绍计量经济学的知识点,还给出很多实用中国案例,并配有软件EViews和STATA的相应操作步骤。
|
內容簡介: |
这是一本面向经济类、管理类本科生和研究生的计量经济学教材,内容主要包括回归模型、时间序列ARIMA模型、单位根检验、误差修正模型和面板数据模型等。 本书在本领域内*次增加蒙特卡洛模拟结果讨论统计量的分布特征,增强读者对统计量分布特征的理解。书中每一个知识点都用简练的语言介绍怎样用计量经济学软件EViews 9 实现计算。书中所提供的案例基本上都是中国建模案例,为计量经济学理论与分析中国经济实际相结合提供切实范例。书中提供多种图(包括散点图、序列图、分布图等),辅助对所研究问题的理解。书中所用全部数据可免费下载。
|
關於作者: |
张晓峒,南开大学数量经济研究所所长,南开大学经济学院教授,数量经济学专业博士生导师。日本大阪市立大学经济学博士。
|
目錄:
|
目录
第1章一元线性回归模型
1.1计量经济学简介与建模步骤
1.2模型的建立及其假定条件
1.2.1建立模型的意义
1.2.2一元线性回归模型的定义
1.2.3一元线性回归模型的经济含义与特征
1.2.4模型的假定条件
1.3一元线性回归模型的参数估计
1.3.1估计方法初探
1.3.2最小二乘估计法原理
1.3.3最小二乘估计的计算
1.4yt,^1和^0的分布
1.4.1yt的分布
1.4.2^1的分布
1.4.3^0的分布
1.52的估计
1.6最小二乘估计量的统计性质
1.6.1线性特性
1.6.2无偏性
1.6.3最小方差性
1.6.4渐近无偏性
1.6.5一致性
1.7最小二乘回归函数的性质
1.8拟合优度的测量
1.9回归系数的显著性检验
1.10回归系数的置信区间
1.11单方程回归模型的预测
1.11.1单个yT 1的点预测
1.11.2单个yT 1的区间预测
1.11.3EyT 1的区间预测
1.12相关分析
1.12.1相关的定义与分类
1.12.2相关系数
1.12.3线性相关系数的局限性
1.12.4简单相关系数的检验
1.13回归系数^1与相关系数r的关系
1.14案例分析
第2章多元线性回归模型
2.1多元线性回归模型及其假定条件
2.1.1模型的建立
2.1.2模型的假定条件
2.2最小二乘法
2.3最小二乘估计量的特性
2.3.1线性特性
2.3.2无偏特性
2.3.3最小方差性
2.3.4渐近无偏性
2.3.5一致性
2.4残差的方差
2.5Y与最小二乘估计量 ^的分布
2.6多重可决系数多重确定系数
2.6.1总平方和、回归平方和与残差平方和
2.6.2多重确定系数R2
2.6.3调整的多重确定系数2
2.7F检验
2.8t检验和回归系数的置信区间
2.9预测
2.9.1yT 1的点预测
2.9.2单个yT 1的置信区间预测
2.9.3EyT 1的置信区间预测
2.9.4预测的评价指标
2.10多元线性回归计算举例
2.11偏相关与复相关
2.11.1偏相关
2.11.2复相关
2.12案例分析
2.13实际建模过程中应该注意的若干问题
第3章可线性化的非线性回归模型
3.1可线性化的7种非线性函数
3.1.1幂函数模型
3.1.2指数函数模型
3.1.3对数函数模型
3.1.4双曲线函数模型
3.1.5多项式函数模型
3.1.6生长曲线函数模型
3.1.7龚伯斯曲线函数模型
3.2可线性化的非线性模型综合案例
3.3可线性化的非线性模型一览表
第4章特殊解释变量
4.1虚拟变量
4.1.1测量截距移动
4.1.2测量斜率变化
4.2工具变量
4.2.1工具变量在一元线性回归模型中的应用
4.2.2工具变量在多元线性回归模型中的应用
4.3滞后变量
4.3.1分布滞后模型
4.3.2自回归模型
4.4随机解释变量
第5章异方差
5.1同方差假定
5.2异方差的表现与来源
5.3模型存在异方差的后果
5.4异方差检验
5.4.1定性分析异方差
5.4.2戈德菲尔德-匡特检验
5.4.3怀特检验
5.4.4戈列瑟检验
5.4.5ARCH自回归条件异方差检验
5.5克服异方差的方法
5.5.1用解释变量或解释变量的算术根除原回归式克服异方差
5.5.2用戈列瑟检验式克服异方差
5.5.3通过对数据取自然对数消除异方差
5.5.4克服异方差的矩阵描述
5.6案例分析
第6章自相关
6.1非自相关假定
6.2自相关的来源与后果
6.3自相关检验
6.3.1图示法
6.3.2DW检验法
6.3.3LM检验亦称BG检验法
6.3.4回归检验法
6.4自相关的解决方法
6.5克服自相关的矩阵描述
6.6自相关系数的估计
6.7案例分析
第7章多重共线性
7.1非多重共线性假定
7.2多重共线性的来源
7.3多重共线性的后果
7.3.1完全多重共线性对参数估计的影响
7.3.2近似共线性对参数估计的影响
7.3.3多重共线性后果的矩阵描述与蒙特卡洛模拟
7.4多重共线性的检测
7.5多重共线性的解决方法
7.5.1直接合并解释变量
7.5.2利用已知信息合并解释变量
7.5.3增加样本容量或重新抽取样本
7.5.4合并截面数据与时间序列数据
7.5.5剔除引起多重共线性的变量
7.6案例分析
7.7多重共线性与解释变量的不正确剔除
7.8违反模型假定条件的其他几种情形
7.8.1被解释变量存在测量误差
7.8.2被解释变量、解释变量同时存在测量误差
7.8.3随机解释变量
7.8.4模型的设定误差
第8章联立方程模型
8.1联立方程模型的概念
8.2联立方程模型的分类
8.2.1结构模型
8.2.2简化型模型
8.2.3递归模型
8.3联立方程模型的识别
8.3.1识别概念
8.3.2结构模型的识别方法
8.4联立方程模型的估计方法
8.4.1递归模型的估计方法
8.4.2简化型模型的估计方法
8.4.3结构模型的估计方法
8.5联立方程模型举例
第9章模型诊断常用统计量与检验
9.1检验模型中全部解释变量都无解释作用的F统计量
9.2检验单个回归系数显著性的t统计量
9.3检验回归系数线性约束条件是否成立的F统计量
9.4似然比统计量
9.5沃尔德(Wald)统计量
9.6拉格朗日乘子统计量
9.7赤池、施瓦茨和汉南奎因统计量
9.8检验正态分布性的JB统计量
9.9格兰杰因果性检验
9.10邹突变点检验
9.11回归系数稳定性的邹检验
9.12递归分析
第10章时间序列ARIMA模型
10.1随机过程与时间序列定义
10.2ARIMA模型的分类
10.2.1自回归模型
10.2.2移动平均模型
10.2.3自回归移动平均模型
10.2.4单整自回归移动平均模型
10.3伍尔德(Wold)分解定理
10.3.1伍尔德分解定理
10.3.2随机过程期望与漂移项的关系
10.4自相关函数及其估计
10.4.1自相关函数
10.4.2自回归过程的自相关函数
10.4.3移动平均过程的自相关函数
10.4.4ARMA过程的自相关函数
10.4.5自相关函数的估计(相关图)
10.5偏自相关函数及其估计
10.5.1偏自相关函数定义
10.5.2偏自相关函数的计算
10.5.3AR、MA、ARMA过程偏自相关函数特征
10.5.4偏自相关函数的估计
10.5.5ARIMA过程自相关函数和偏自相关函数特征总结
10.6ARIMA模型的建立、估计过程与预测
10.6.1模型的识别
10.6.2模型参数的估计
10.6.3模型的诊断与检验
10.6.4ARIMA模型预测
10.7ARIMA模型建模案例
10.8季节时间序列ARIMA模型
10.8.1季节时间序列模型定义
10.8.2季节随机过程的自相关函数和偏自相关函数
10.8.3季节ARIMA模型的识别、拟合、检验与预测
10.8.4季节ARIMA模型建模案例
10.9回归与ARMA组合模型(regARIMA模型)
10.9.1回归与ARMA组合模型定义
10.9.2回归与ARMA组合模型案例分析
第11章虚假回归
11.1问题的提出
11.2单整性定义
11.3单整序列的统计特征
11.4虚假回归
第12章单位根检验
12.14种典型的非平稳过程
12.1.1随机游走过程
12.1.2随机趋势过程
12.1.3趋势平稳过程
12.1.4趋势非平稳过程
12.2DF,T^-1统计量的分布特征
12.2.1DF统计量的分布特征
12.2.2ARp含单位根过程的DF统计量分布特征
12.2.3误差项为ARMA形式的I1过程DF分布特征
12.2.4DF检验式中t^,t^和F统计量的分布特征
12.2.5T^-1统计量的分布特征
12.2.6趋势过程中t统计量的分布特征
12.3单位根检验
12.3.1单位根检验原理
12.3.2单位根检验步骤
12.4单位根检验的EViews 9操作
12.5单位根检验案例分析
12.6结构突变序列的单位根检验
第13章单方程误差修正模型
13.1均衡概念
13.2误差修正模型
13.2.1自回归分布滞后模型
13.2.2误差修正模型定义
13.3协整定义
13.4协整检验
13.4.1以残差为基础的协整检验法
13.4.2协整系数的分布滞后模型估计法
13.5格兰杰定理
13.5.1多项式矩阵
13.5.2格兰杰Granger定理
13.5.3举例验证格兰杰定理
13.6建立单方程误差修正模型的EG两步法
13.6.1EG两步法
13.6.2单方程误差修正模型案例分析
第14章面板数据模型
14.1面板数据的定义
14.2面板数据模型分类
14.2.1混合模型
14.2.2固定效应模型
14.2.3随机效应模型
14.3面板数据模型估计方法
14.3.1混合最小二乘估计
14.3.2组内估计
14.3.3最小二乘虚拟变量估计法
14.3.4一阶差分估计
14.3.5可行GLS估计法(随机效应估计法)
14.3.6面板数据模型拟合优度的测量
14.4面板数据模型的设定与检验
14.4.1F检验
14.4.2H检验
14.4.3Wald检验
14.4.4F检验和LR检验
14.5面板数据建模案例分析
14.6面板数据建模的EViews 9操作
14.6.1Pool(混合)数据工作文件的建立,模型的估计、检验与预测
14.6.2面板数据panel型工作文件的建立,模型估计与检验
附录A随机变量、概率极限、矩阵代数知识简介
附录B统计分布表
附表1相关系数临界值表
附表2标准正态分布函数表
附表3t分布百分位数表
附表42分布百分位数表
附表5F分布百分位数表
附表6DW检验临界值表=0.05
附表7DF分布百分位数表
附表8t^检验临界值表yt= yt-1 ut中检验=0
附表9F检验临界值表yt= yt-1 ut中检验==0
附表10t^检验临界值表yt= t yt-1 ut中检验=0
附表11t^检验临界值表yt= t yt-1 ut中检验=0
附表12F检验临界值表yt= t yt-1 ut中检验==0
附表13T^-1分布百分位数表
附表14EG和AEG协整检验临界值表
附表15协整检验临界值表
附录CEViews 9使用简介
参考文献
|
內容試閱:
|
前言
本书主要由回归模型、时间序列ARIMA模型、单位根检验和误差修正模型、面板数据模型等内容组成。读者对象是大专院校的本科生、硕士研究生以及从事经济、管理等领域研究的学者、工作者和教师。若讲授完本书全部内容再加上安排上机时间,大约需要100学时。本书共分14章。其中第1~9章基本上属于经典计量经济学的内容。第10章介绍时间序列ARIMA模型,第11章和第12章介绍非平稳时间序列以及单位根检验。第13章介绍单方程误差修正模型。第14章介绍面板数据模型。第11~14章属于计量经济学中比较新的内容,系统介绍第11~14章内容的本科生教材以往并不多见。本书具有如下一些特点。用现代手段和视角分析经典计量经济学知识和非平稳相关统计量的分布特征。例如,对OLS回归估计量、异方差、自相关、多重共线性、动态模型回归系数估计量分布的讨论,既给出理论推导,又给出蒙特卡洛模拟结果,将会使读者更容易理解所学习的内容。蒙特卡洛模拟方法是分析统计量分布特征的重要方法,但是对于十多年前的国内来说,是不可能做到的事情,主要是受计算机运算速度的影响。现在,计算机运算速度早已今非昔比,所以是用蒙特卡洛模拟方法研究、讲授统计量分布特征的时候了。本书还给出了非平稳时间序列建模,虚假回归,虚假相关,单整、协整相关统计量分布特征的蒙特卡洛模拟结果。蒙特卡洛模拟方法有助于读者对统计量分布特征的理解。把时间序列ARIMA模型引入计量经济学教材。从当前看,ARIMA模型是计量经济学理论的重要组成部分。而20世纪的计量经济学教材则主要以介绍回归模型为主,很少或根本不涉及ARIMA模型部分。计量经济学理论发展到今天,如果不学习ARIMA模型,则单位根检验,单整、协整理论,组合(regARIMA)模型,误差修正模型等知识根本无法掌握。在介绍计量经济模型的方式上坚持3个环节并举: 介绍计量经济模型的理论知识,介绍与其相联系的典型案例分析,介绍与案例分析相对应的计量经济建模的EViews 9操作。如果读者自己再运用专用软件EViews和STATA进行练习,则一定会完美掌握本书所提供的计量经济学知识。凡是样本容量不大的数据在书中相应例子和案例的位置都已经给出,而书中全部例子和案例的样本数据则以EViews和STATA数据文件的形式在清华大学出版社官方网站(http:www.tup.com.cn)和书中的二维码上给出。读者可免费下载,也可以直接向作者索取。所有数据文件的编号都与书中例子和案例的编号相对应。用li表示例子的编号,case表示案例的编号。比如,li 133表示第13章第3个例子; case 151表示第15章第1个案例。STATA文件名与EViews数据文件的命名方法相同。
EViews数据文件
STATA数据文件
书中所提供的案例基本上都是中国建模案例。因为读者对中国的国情最为熟悉,用中国案例分析建模过程和估计结果,读者最容易理解,同时也为计量经济学理论与分析中国经济实际相结合提供切实的范例。书中在表达模型时,所有的变量都用英文字母,所有模型的参数都用希腊字母表示。书的最后提供三个附录。附录A给出推断统计学与矩阵知识的简要介绍,供读者查阅。附录B给出15个假设检验用表。附录C给出EViews 9 使用简介,有助于读者对计量经济学软件EViews 9的运用与掌握。书中每一个知识点都给出EViews 9操作的简要说明。非平稳序列相关统计量极限分布的推导过程本书未给出,作者认为已超出了本科生和硕士研究生的知识范围,如果读者感兴趣,可以参考更高层次的计量经济学著作。本书第4章和第5章初稿由赵娜博士撰写,其余部分则均由张晓峒撰写。张晓峒为全书最终定稿。本书是作者在多年教学讲稿基础之上撰写而成的。徐鹏博士、何永涛博士、郭小稚博士、涂晓枫博士生、刘笑时博士生等参与了本书的案例数据收集工作,以及计算机操作方法的整理等大量工作,博士生梁方参与了第11章编程工作,在此表示感谢。本书在撰写过程中得到清华大学出版社的支持,在此向清华大学出版社表示感谢。本书在出版过程中策划编辑张伟付出很多,在此一并表示感谢。书中难免存在不足和错误,还请读者不吝赐教、指正。张晓峒
zhangnk710@126.com
2017年1月10日
第1章一元线性回归模型
本章在1.1节给出计量经济学简介与建模步骤,第1章介绍一元线性回归模型。内容包括模型的建立及其假定条件、一元线性回归模型的系数估计、最小二乘OLS估计方法、回归系数估计量的分布、最小二乘估计量的统计性质、最小二乘回归方程的性质、拟合优度的测量、回归系数的显著性检验、回归系数的置信区间、模型的预测、案例分析等。1.1计量经济学简介与建模步骤计量经济学,国内也称经济计量学对应的英文词都是econometrics。计量经济学是指用定量与定性相结合的方法研究经济活动规律及其应用的科学。它是经济学与统计学、数学相结合的交叉学科。计量经济学作为一个专有名词是1926年由挪威经济学家弗里希R. Frisch提出的。随后1930年成立了国际计量经济学学会,1933年创办了《计量经济学》杂志。至今已有80多年的历史。我国1980年正式引进计量经济学。标志是中国社会科学院邀请美国以诺贝尔经济学奖获得者、美国宾夕法尼亚大学克莱因教授为首的7位计量经济学家开办计量经济学讲习班。之后计量经济学在中国得到迅速发展。1998年教育部高等学校经济学学科教学指导委员会正式将计量经济学列为高等学校经济学门类各专业本科生的8门必修课之一。计量经济学以20世纪70年代为界,之前的研究成果多属于经典计量经济学范畴,之后的研究成果多属于非经典计量经济学范畴。随着时间的推移,计量经济学逐渐渗透到经济学各个领域形成了新的计量经济学分支,如金融计量经济学、时间序列计量经济学、空间计量经济学等。也有人按研究对象把计量经济学分为宏观计量经济学和微观计量经济学。计量经济模型,即研究经济、人文问题所建立的定量分析模型。其中使用时间最久的是回归模型,如果以高斯C.F.Gauss提出最小二乘估计方法为标志,则已经有208年的历史了。但真正建立起一套完整的设定、估计、推断、检验体系是在20世纪30年代。20世纪40年代以前建立的基本上是单方程回归模型。40年代以后随着计算机的发展,以及人们着眼于对宏观经济的研究,开始建立联立方程模型。20世纪70年代初,BoxJenkins提出研究时间序列的ARIMA模型。20世纪70年代以后随着计算机以及计算机专用软件的逐步普及,各种模型被提出,研究成果呈爆炸式增长。计量经济学的研究内容与目的主要有以下两个。1 定量描述与分析经济活动。包括描述宏观、微观经济问题,寻找和验证经济规律、建立计量经济模型。通过计量模型得到回归系数边际系数、弹性系数、技术系数、比率、速率等的可靠估计值,从而为分析经济问题、制定相关经济政策、实施宏观经济调控提供依据。例如,19622001年中国储蓄存款总额Y,亿元与国内生产总值GDP,亿元关系的估计结果如下:
LnYt=-8.7350 1.7443LnGDPt 1.1840AR1-0.3511AR2
-13.625.27.8-2.3
R2=0.998,DW=1.64,T=40,19622001
通过回归系数估计值可知,19622001年中国储蓄存款总额Y与GDP的关系是,GDP每增加1%,中国储蓄存款总额平均增加1.7443%。中国储蓄存款总额的增长速度远大于GDP的增长速度。这为了解、掌控中国储蓄存款总额,制定相关政策提供重要依据。2 做经济预测。这是计量经济学利用模型所要解决的最重要任务,但也是最困难的任务。计量经济学的发展史就是谋求对经济变量做出更精确预测的发展史。要想得到经济变量之间的精确关系,就必须使用计量经济学的建模研究方法。建立计量经济模型一般分为4个步骤。1 确定研究对象和影响因素的测量变量。比如,研究中国经济,使用GDP还是GNP国民生产总值做测量变量要首先确定下来。不容易度量的对象要找合理的替代变量。比如,商品需求量常用销售量代替。注意: 研究对象必须是可量化的、可观测的。2 收集数据。收集数据分为直接收集和间接收集两种。直接收集数据即亲自做调查。调查分普查和抽样调查两种。普查即对每一个观测对象做调查。抽样调查方法分多种,有简单随机抽样、分层抽样、整群抽样、系统抽样等。抽样调查时,还可把这些方法结合在一起使用。如何使调查的数据最大限度地反映总体特征,应该是研究者关注的内容。理论上属于统计学领域研究的内容。间接收集数据即从各种统计年鉴、网站、数据库等处引用数据。引用数据时要时刻注意,引用的数据是否与自己想要得到的数据定义相符。比如,想要得到农业劳动人口数据,但引用的是统计年鉴上的农村人口数据,这其实是两个概念。其后果相当于给变量的测量引入测量误差。无论亲自收集数据还是引用数据都要注意不要出现错误。数据出现错误,相当于给变量的测量引入误差,将直接导致对模型参数的估计出现偏倚。在估计模型前,一定要检查数据,避免存在错误。3 仔细观察,分析变量的时间序列图和散点图。一定要养成这样的习惯。通过对变量的观察可以为建立计量经济模型提供许多有用的信息。4 根据经济理论和对问题的调查研究与深入了解,设定计量经济模型的具体形式,估计模型,对估计结果进行诊断与检验,最终确定模型估计结果。分析回归系数,解释其经济含义,对研究对象进行预测,等等。以往在计量经济学著作中常强调在经济理论的基础上建立计量经济模型。建立计量经济模型的目的也只是验证经济理论。实际上这只是问题的一个方面。建立计量经济模型的目的还有发现经济理论的一面。社会发展是无止境的,人类对经济发展规律的认识与探索也是无止境的。人们对经济活动规律的研究绝不只是验证,一定还包括发现。以经济学中的恩格尔定律为例,德国统计学家恩斯特恩格尔在1857年利用埃朵杜皮惕Edouard Ducpetiaux收集的198个比利时家庭的收入与食物支出数据,采用一元线性回归的方法,发现了著名的恩格尔定律。虽然那时还没有计量经济学这个名称,但是,这毕竟是运用计量经济学的方法发现了一个经济理论,恩格尔定律。计量经济学研究的主要内容是上述建模步骤的第3步和第4步。实际上,主要是第4步。本书主要围绕第4步内容展开。1.2模型的建立及其假定条件1.2.1建立模型的意义
在经济领域,一个变量的变化常常受其他多个经济变量的影响。为描述这些变量之间的关系,研究这些变量之间的变化规律,通常要建立计量经济模型,研究模型回归系数,进而利用计量经济模型进行预测。比如只有一个重要变量xt影响变量yt变化,且它们之间的关系是线性的,则建立的应是一元线性回归模型。1.2.2一元线性回归模型的定义一元线性回归模型表示如下:
yt=0 1xt ut11
式11表示变量yt和xt之间的真实关系。其中yt称作被解释变量相依变量、因变量,xt称作解释变量独立变量、自变量、回归因子,ut称作随机误差项随机扰动项,0称作常数项截距项,1称作回归系数。通常,0和1又统称为模型的回归系数。在模型11中,xt是影响yt变化的重要解释变量。回归系数0和1具体描述这种关系。0和1通常是未知的,需要估计。如果xt和yt是截面数据,t表示序数; 如果xt和yt是时间序列数据,t表示时间序数。ut则包括除xt以外的影响yt变化的众多微小因素。ut的变化是不可控的。上述模型可以分为两部分: ① 0 1xt是非随机部分; ② ut是随机部分。
1.2.3一元线性回归模型的经济含义与特征这种模型可以赋予各种实际意义,如支出与收入的关系; 商品价格与供给量的关系; 基本建设投资与国内生产总值的关系; 林区木材采伐量与其剩余物的关系; 脉搏与血压的关系; 身高与体重的关系; 等等。以研究家庭支出与收入的关系为例。假设家庭支出与收入呈线性函数关系。实际上,数据来自各个不同家庭,来自各个不同收入水平,从而使收入以外的影响支出变化的其他因素维持不变是不可能的。随机误差项ut中包括了家庭人口数、消费习惯、不同地域的物价水平、家庭的额外收入等因素。所以在研究经济问题中控制其他因素不变是不可能的。因此,即便yt与xt呈完全线性关系,由yt与xt数据得到的观测点也不在一条直线上不呈线性函数关系,而是散布在一条直线周围,这些观测点服从回归关系,见图11,其中直线Eyt=0 1xt称作真实的回归直线[Eyt是yt的期望,在1.4节将进一步介绍],描述yt与xt的真实关系。式11中的ut,即观测点到Eyt的垂直距离,表示由于众多随机因素的影响使一个具体观测点偏离回归直线的幅度。
图11真实的回归直线
一般来说,回归模型的随机误差项中包括如下几项内容。1 未在模型中专门列出的影响yt变化的非重要解释变量。如上例中家庭人口数、消费习惯、物价水平差异等因素的影响都包括在随机误差项中。2 人的随机行为。经济活动都是人参与的。人的经济行为的变化也会对随机误差项产生影响。3 数学模型形式欠妥。对于同一组观测值,若拟合的数学模型形式不同,则相应的随机误差项的值也不同。显然当模型形式欠妥时,会直接对随机误差项的值造成影响。4 归并误差。模型中被解释变量的值常常是归并而成的。当归并不合理时,会产生归并误差。比如由不同种类粮食合并构成的粮食产量的不合理归并会带来归并误差。5 测量误差等。当对被解释变量的测量存在误差时,这种误差将包括在随机误差项中。
1.2.4模型的假定条件在对回归函数进行估计之前应该对回归模型的随机误差项ut和解释变量做出如下假定。随后介绍的估计回归系数的最小二乘法是以如下假定条件为基础的。1 ut,t=1,2,,T ,是T个随机变量,ut的取值服从概率分布。2 Eut=0,t=1,2,,T 。上式表示ut在t的每一个点的期望都为零。在模型中如果能保证ut中所包含的都是影响yt的微小因素,那么在众多微小因素的作用下,假定Eut=0就是合理的。3 varut=E[ut-Eut]2=Eut2=2,t=1,2,,T 。这个假定的含义是在t的每一个点的ut,t=1,2,,T 分布的方差都是常量2。此条件下,称ut具有同方差性。当此条件得不到满足时,称ut具有异方差性。4 ut服从正态分布。根据中心极限定理,如果能保证ut由众多的随机因素组成,且每个因素在总的变化中都起不到主导的作用,那么就可以认为ut近似地服从正态分布。以上4个假定条件可表达如下:
ut~N0,2
5 covui,uj=E[ui-Euiuj-Euj]=Eui,uj=0,ij 。本假定条件只针对时间序列数据。上式含义是不同观测值所对应的随机误差项相互独立。ui取值不受uj影响; 反过来,uj取值也不受ui影响。此条件下,对于时间序列数据,称ut是非自相关的。当covui,uj0时,称ut具有自相关性。6 xt是非随机的。xt的值是事先确定的。注意,这一假定条件在自然科学领域的实验研究中容易得到满足,因为实验是可控的,而在经济领域内,xt的观测是不可控的,所以这一假定条件不容易满足。7 covut,xt=0。ut与xt要相互独立,否则分不清yt的变化是由ut所致还是由xt所致。8 对于含有多个解释变量的线性回归模型,解释变量之间不能完全相关或高度相关。否则称解释变量之间存在多重共线性。本假定条件在第2章有详细讨论。在假定1、2成立条件下有Eyt=E0 1xt ut=0 1xt。称Eyt为真实的回归函数。通常线性回归函数Eyt=0 1xt是观测不到的,利用样本得到的只是对它的估计,即对0和1的估计。Eyt=0 1xt是回归模型11的一部分。由此可见回归模型有两个特点。①建立在某些假定条件成立前提下抽象出来的回归函数不能百分之百地再现所研究的经济过程。②从另一方面看,也正是由于这些假定,才能对经济问题进行高度抽象,从而更深刻地揭示经济变量之间的变化规律。
1.3一元线性回归模型的参数估计回归模型的参数除了包括回归系数之外,还包括人们关心的其他一些需要估计的量,如模型误差项的均值和方差等。1.3.1估计方法初探对于所研究的经济问题,假定变量yt和xt之间服从线性关系。通常真实的回归直线是观测不到的。收集样本的目的就是要对这条真实的回归直线做出估计。设估计的回归直线用
y^t=^0 ^1xt12
表示。其中y^t称作yt的拟合值,^0和^1分别是0和1的估计量。观测点到这条估计的回归直线的纵向距离用u^t表示。u^t称作残差,u^t是对ut的估计。
yt=y^t u^t=^0 ^1xt u^t13
称作估计的回归模型。由上式知u^t=yt-y^t。怎样估计回归直线12呢?显然综合起来看,这条直线处于样本数据的中心位置最合理。怎样用数学语言描述处于样本数据的中心位置?1 用残差和最小作为确定直线位置的标准,但很快发现计算残差和存在相互抵消的问题,不能用于实际计算。2 用残差绝对值的和最小确定直线位置也是一个途径,但绝对值的计算比较麻烦。应进一步寻找更好的估计方法。
1.3.2最小二乘估计法原理最小二乘法OLS最小二乘法亦称最小平方法。德国数学家高斯Carl Friedrich Gauss对最小二乘法的建立贡献最大。1795年高斯就想到这种方法,但正式提出来是在1809年。在这期间法国数学家勒让德A.M.Legendre在1805年发表的论文中提出最小二乘估计方法。的估计原理是以残差平方和Tt=1u^2t最小为原则确定直线位置。这种估计方法的特点是对远离回归直线的观测点给予更大的关注。用最小二乘法估计回归系数除了计算比较方便外,得到的估计量还具有优良的统计特性见1.6节。
1.3.3最小二乘估计的计算设残差平方和用Q表示:
Q=Tt=1u^2t=Tt=1yt-y^t2=Tt=1yt-^0-^1xt214
OLS法是以Q取最小值为条件确定回归直线,即确定^0和^1的值。当样本已知时,上式中的yt,xt是已知量,^0和^1是未知量。把Q看作^0和^1的函数。这是一个二元函数求极值问题。解法是求Q对^0和^1的偏导数并令其为零,得正规方程如下:
Q^0=2Tt=1yt-^0-^1xt-1=015
Q^1=2Tt=1yt-^0-^1xt-xt=016
由式15、式16得
Ti=1yt-^0-^1xt=017
Ti=1yt-^0-^1xtxt=018
式17两侧用T除,并移项整理,得
^0=y--^1x-19
把上式代入式18并整理,得
Ti=1[yt-y--^1xt-x-]xt=0
Ti=1yt-y-xt-^1Ti=1xt-x-xt=0
为书写简便,自本章始,如不做特别说明,把Tt=1简写为。由上式得
^1=xtyt-y-xt-x-xt
因为x-yt-y-=0,x-xt-x-=0,在上式等号右侧分式的分子和分母上分别减x-yt-y-和x-xt-x-得
^1=xtyt-y--x-yt-y-xt-x-xt-x-xt-x-=xt-x-yt-y-xt-x-2110
式110和式19就是回归系数1、0的OLS法估计公式。
1.4yt, ^1和^0的分布因为yt是随机变量,而回归系数估计量^1和^0是由yt计算出来的,所以^1和^0也是随机变量。下面讨论yt、^1、^0的分布,目的是为研究^1和^0的性质以及假设检验做理论准备。
1.4.1yt的分布根据假定条件ut~N0,2 ,得yt的期望:
Eyt=E0 1xt ut=0 1xt Eut=0 1xt
Eyt=0 1xt表示真实的回归直线。当xt固定时,Eyt表示yt的期望值。
varyt=var0 1xt ut=var0 1xt varut=2
在上式的推导中用到了假定条件6,xt是非随机的。根据模型11,yt是ut的线性函数。因为根据假定条件,ut服从正态分布,所以yt也服从正态分布。
yt~N0 1xt,2111
1.4.2^1的分布下面讨论^1的分布。先求^1的期望。由式110得
^1=xt-x-tyt-y-txt-x-2=xt-x-tyt-y-txt-x-txt-x-2
=xt-x-tytxt-x-2112
根据假定6,xi是非随机的,所以令
kt=xt-x-txt-x-2113
代入式112,得
^1=ktyt114
则
E^1=Ektyt=Ekt0 1xt ut
=E0kt 1ktxt ktut
=E1ktxt-x- ktut其中ktxt-x-=ktxt
=1 Ektut=1115
在上式的推导过程中利用了结论,kt=0,ktx-=0。求^1的方差。由上式有^1=1 ktut。则
var^1=var1 ktut=varktut=k2t2
利用式113得
var^1=xt-x-txt-x-222=2xt-x-2116
因为^1是yt的线性函数[见式114],yt服从正态分布,所以^1也服从正态分布。
^1~N 1,1xt-x-22 117
1.4.3^0的分布由式19和式114
^0=y--^1x-=1Tyt-x-ktyt=1T-x-ktyt
=1T-x-kt0 1xt ut
=1T0 11Txt 1Tut-0x-kt-1x-ktxt-x-ktut118
因为
kt=0,ktxt=ktxt-x-=1
所以式118变为
^0=0 1x- 1Tut-1x--x-ktut
=0 1Tut-x-ktut
=0 1T-x-ktut119
则
E^0=E0 E1T-x-ktut
=0 1T-x-ktEut=0120
由式119得
var^0=var0 1T-x-ktut=var1T-x-ktut
=21T-x-kt2
=21T2-21Tx-kt x-2k2t
因为
kt=0,x-2k2t=x-21xt-x-2
所以
var^0=21T x-2xt-x-2=2xt-x-2 Tx-2Txt-x-2121
因为
xt-x-2=x2t-2x-xt Tx-2
=x2t-2Tx-2 Tx-2=x2t-Tx-2
所以
xt-x-2 Tx-2=x2t
把上式代入式121,得
var^0=x2tTxt-x-22122
由式19,^0也是yt的函数,所以^0也服从正态分布。
^0~N0,x2tTxt-x-22123
1.52的估计见式116和式122,为了估计^0和^1的方差,必须先估计2。若用^2或s2表示对2的估计,则
^2=s2=u^2tT-2124
其中T表示样本容量,2表示回归函数中被估系数^0和^1的个数。因为u^t是残差,所以^2又称作误差均方。^2是2的无偏估计量,可用来考察观测值对回归直线的离散程度。用^2代替式116和式122中的2,就得到了^0和^1的估计方差的计算公式。
s2^1=var^^1=^21xt-x-2=u^2tT-21xt-x-2125
s2^0=var^^0=^2x2tTxt-x-2=u^2tT-2x2tTxt-x-2126
1.6最小二乘估计量的统计性质1.6.1线性特性
这里指^0和^1分别是yt的线性函数。重写式114如下:
^1=ktyt
其中
kt=xt-x-txt-x-2
根据假定6,xi是非随机的,所以^1是yt的线性函数。称^1为线性估计量。因为
^0=y--^1x-=1Tyt-x-ktyt=1T-x-ktyt
|
|