一本很好的计量书!.pdf
学习文档 1 2 感谢所有人。 Thanks for all the people. 李昊1 lihao9153@163.com2 吉首大学(湖南) My E-mail -2- 目 录 目 录 第一章 前言 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1.1 1.2 1.3 1.4 什么是计量经济学 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 计量经济学的研究目的 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 计量经济模型及其应用 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 计量经济学的内容体系 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 4 4 6 第二章 估计方法引论 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 2.1 2.2 2.3 2.4 2.5 2.6 2.7 2.8 2.9 2.10 2.11 2.12 2.13 2.14 2.15 2.16 德尔塔方法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 修正的普通最小二乘估计 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 普通最小二乘估计 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 广义最小二乘估计 Feasible Generalized Least Squares . . . . . . . . . . . . . . . . . . . 10 分部回归法 Partitioned Regression . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 偏回归估计 Partial Regression . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 两阶段最小二乘 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 交叉估计方法 Across Regression . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 最大似然估计方法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 贝叶斯估计 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17 渐近方法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18 广义矩方法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 稳健估计 robust estimation method. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 工具变量法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 蒙特卡罗模拟 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 例子 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33 第三章 经济计量检验 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34 3.1 3.2 3.3 3.4 3.5 3.6 3.7 3.8 3.9 3.10 3.11 3.12 3.13 3.14 异方差问题 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34 序列相关性 Serial Corre1ation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40 多重共线性 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47 非正态误差问题 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52 随机解释变量问题 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56 模型设定误差及模型确认检验 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56 格兰杰因果性检验 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61 内生性 Hausman 检验 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62 检验白噪声的 Q 统计量 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62 回归系数的稳定性检验 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63 方差不等结构变化的检验 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63 模型稳定性检验 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63 非嵌套假设检验 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64 Leamer 的EBA 分析法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66 -i- 目 录 3.15 3.16 3.17 3.18 3.19 3.20 3.21 3.22 异常值 outlier . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66 βj 的联合置信区间. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67 预测的评价指标 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67 协方差分析检验 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67 模型筛选准则 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68 一般的线性假设检验:沃尔德检验、似然比检验与拉格朗日检验 . . . . . . . . . . 69 计量经济模型设定检验 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72 多元回归模型的假设检验 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72 第四章 线性回归模型 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74 4.1 4.2 4.3 4.4 古典线性模型 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74 一元线性回归模型 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79 虚拟变量 dummy variable . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82 总结 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83 第五章 经典单方程计量经济学模型的扩展 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84 5.1 5.2 5.3 5.4 5.5 前言 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84 经典计量经济学模型 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84 非线性经济计量检验 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89 变参数线性计量经济学模型 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92 小结 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98 第六章 联立方程计量经济学模型理论与方法 . . . . . . . . . . . . . . . . . . . . . . . . . . 100 6.1 6.2 6.3 6.4 6.5 6.6 6.7 前言 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100 联立方程组模型Simultaneous Equations Models . . . . . . . . . . . . . . . . . . . . . . . . . . 101 联立方程模型的识别(identification) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104 递归模型与似乎不相关模型 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107 联立方程模型的估计方法 Estimation Methods . . . . . . . . . . . . . . . . . . . . . . . . . . . 108 工具变量估计与两阶段最小二乘法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117 总结 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118 第七章 时间序列计量经济学模型理论与方法 . . . . . . . . . . . . . . . . . . . . . . . . . . 119 7.1 7.2 7.3 7.4 7.5 7.6 7.7 7.8 7.9 7.10 7.11 基础知识 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119 时间序列回归中的序列相关和异方差. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .124 确定性时间序列模型 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126 单整的单位根检验 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127 协整cointegration . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128 自回归与移动平均过程 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130 自相关函数与偏自相关函数 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132 随机时间序列分析模型(AR、MA、ARMA)的估计 . . . . . . . . . . . . . . . . . . . . 136 传递函数模型 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138 时间序列ARIMA建模:BOX-Jenkiens . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138 ARCH 模型. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .141 - ii - 目 录 7.12 多项式分布滞后模型Polynomial distributed lags PDLs . . . . . . . . . . . . . . . . . . . 142 7.13 无限分布滞后模型 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142 7.14 几何(或考依克)分布滞后 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143 7.15 有理分布滞后模型 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143 7.16 趋势和季节性 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143 7.17 总结 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 144 第八章 横截面时间序列模型 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 145 8.1 基本原理 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 145 8.2 模型的设定检验 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147 8.3 数据类型非经典的计量经济学模型:面板数据模型. . . . . . . . . . . . . . . . . . . . . . .148 第九章 非参数回归计量经济学模型理论与方法 . . . . . . . . . . . . . . . . . . . . . . . 154 9.1 前言 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 154 9.2 非参数统计讲义 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 154 9.3 Histogram . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 156 9.4 Nonparametric density estimation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 158 9.5 无参数回归模型 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 160 9.6 半参数非回归模型 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 168 9.7 小结 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 168 第十章 soft . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 169 10.1 Eviews . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 169 10.2 点预测 Point Forecasts . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 170 10.3 Maple. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .171 10.4 matlab . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171 10.5 SAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 182 10.6 宏 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 190 第十一章 学习摘要 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .193 11.1 趋势稳定过程与单位根过程 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 193 11.2 结构突变的趋势稳定 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 193 11.3 外生性结构突变的单位根及其检验 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 194 附录A 图表 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 195 §A.1 自相关和偏自相关函数表 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 196 §A.2 ADF 检验表 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 197 §A.3 相关系数临界值检验表 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 198 附录B 数学公式证明与推导 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 204 §B.1 自相关函数通解表达式的证明 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 204 §B.2 密度函数估计的渐近无偏性与相合性证明 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 204 - iii - 目 录 附录C 词汇表 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 206 §C.1 A . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 206 §C.2 B . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 207 §C.3 C . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 208 §C.4 D . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 209 §C.5 E . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 210 §C.6 I . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 211 §C.7 L . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 212 §C.8 M. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .213 §C.9 O . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 214 §C.10 P . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 215 §C.11 Q . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 216 §C.12 R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 217 §C.13 S . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 218 §C.14 T . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 219 §C.15 U . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 220 §C.16 V . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 221 §C.17 W . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 222 参考文献 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 223 - iv - 第一章 前言 第一章 前言 来自[1]、[2]、[3]、[4]。 1.1 什么是计量经济学 计量 经 济学 定义 弗里希在世界计量经济学会会刊《Econometric》的发刊词中写道: ”对经济的数量研究有几个方面,其中任何一个方面都不应和计量经济学混为一谈。 计量经济学绝不等同于经济统计学,它也不同于我们所说的一般经济理论,计量经 济学也不应该视为数学应用于经济学的同义语。经验表明,统计学、经济理论和数 学三者对于实际理解现代经济生活的数量关系都是必要的,但其中任何单独一种都 是不够的。三者的结合才是有力的工具,正是这三者的统一才构成了计量经济学。” 一般将计量经济学定义为”一门由经济学、统计学和数学结合而成的交叉学科,是一门经济学 科”。但由于计算的复杂性,使人们只能建立小规模的简单模型,而随着计算机技术的迅速发 展,为计量经济学提供了强有力的工具,使许多复杂的大规模模型得以应用。所以还可以将计 量经济学定义为:”计量经济学是以经济理论为指导,以数据事实为依据,以数学为方法、以 计算机技术为手段,研究经济关系和经济活动数量规律及其应用,并以建立和应用计量经济学 模型为核心的一门经济学学科。” 另外,计量经济学也指以 R.F resh 等同时代的经济学家基于概率论和数量统计而创建的计 量经济方法论。计 计 量 经 济 学 学 科 的 形 成 英文”Econometrics”最早是由 R.F rish于 1926年模仿 ”Biometrics”(生物计量学)提出的,标志着计量经济学的诞生。但人们一般认为,1930 年 12月∼ 29 日世界计量经济学会成立和由她创办的学术刊物《Econometrica》于 1933 年正式出 版,标志着计量经济学作为一个独立学科正式诞生了。经 经济计量 学 的发 展 (20 - 40) 年 代 本世纪之前,在错综复杂的经济现象面前,经济工作者主要是使用头脑直接对材料进行归 纳、综合和推理。十九世纪欧洲主要国家先后进入资本主义社会。工业化大生产的出现,经济 活动规模的不断扩大,需要人们对经济问题做出更精确、深入的分析、解释与判断。这是计量 经济学诞生的社会基础。 到本世纪初,数学、统计学理论日趋完善为计量经济学的出现奠定了理论基础。 17 世纪 N ewton − Leibniz 提出微积分,19 世纪初(1809年)德国数学家 Gauss 提出最小 二乘法,1821 年提出正态分布理论。19 世纪末英国统计学家 Galton 提出”回归”概念。本世纪 20 年代 F isherR.(英 1890 − 1962)和 N eymanJ.D.(波兰裔美国人)分别提出抽样分布和假 设检验理论。至此,数理统计的理论框架基本形成。这时,人们自然想到要用这些知识解释、 分析、研究经济问题,从而诞生了计量经济学。 ”计量经济学”一词首先由挪威经济学家 F risch仿照生物计量学(biometrics)一词于 1926 年提出。1930 年由 F risch,T inbergen 和 F isher 等人发起在美国成立了国际计量经济学 会。1933年 1 月开始出版”计量经济学”(Econometrica)杂志。目前它仍是计量经济学界最权 威的杂志。 30 年代计量经济学研究对象主要是个别生产者、消费者、家庭、厂商等。基本上属于微观 分析范畴。第二次世界大战后,计算机的发展与应用给计量经济学的研究起了巨大推动作用。 从 40 年代起,计量经济学研究从微观向局部地区扩大,以至整个社会的宏观经济体系,处理 总体形态的数据,如国民消费、国民收入、投资、失业问题等。但模型基本上属于单一方程形 式。 50 - 70 年 代 1950 年以 Koopman 发表论文”动态经济模型的统计推断”和 Koopman−Hood 发表论文”线性联立经济关系的估计”为标志,经济计量学理论进入联立方程模型时代。 -1- 1.1 什么是计量经济学 经济计量学研究经历了从简单到复杂,从单一方程到联立方程的变化过程。进入五十年代 人们开始用联立方程模型描述一个国家整体的宏观经济活动。比较著名的是 Klein 的美国经济 波动模型(1921 ∼ 1941,1950 年作)和美国宏观经济模型(1928 ∼ 1950,1955 年作)后者包 括 20 个方程。联立方程模型的应用是经济计量学发展的第二个里程碑。 进入 70 年代西方国家致力于更大规模的宏观模型研究。从着眼于国内发展到着眼于国际的 大型经济计量模型。研究国际经济波动的影响,国际经济发展战略可能引起的各种后果,以及 制定评价长期的经济政策。70 年代是联立方程模型发展最辉煌的时代。最著名的联立方程模型 是”连接计划”(LinkP roject)。截止 1987 年,已包括 78 个国家 2 万个方程。这一时期最有 代表性的学者是 L.Klein 教授。他于 1980 年获诺贝尔经济学奖。 前苏联在本世纪 20 年代也开展过这方面的研究,但到 30 年代就中止了。60 年代中期以 来,前苏联及东欧一些国家开始大量编制投入产出模型并取得有益成果。 80 - 90 年 代 因为七十年代以前的建模技术都是以”经济时间序列平稳”这一前提设计 的,而战后多数国家的宏观经济变量均呈非平稳特征,所以在利用联立方程模型对非平稳 经济变量进行预测时常常失败。从 70 年代开始,宏观经济变量的非平稳性问题以及虚假回 归问题越来越引起人们的注意。因为这些问题的存在会直接影响经济计量模型参数估计的准 确性。Granger − N ewbold于 1974 年首先提出虚假回归问题,引起了计量经济学界的注意。 Box − Jenkins 1967 年出版《时间序列分析,预测与控制》一书。时间序列模型有别于回归 模型,是一种全新的建模方法,它是依靠变量本身的外推机制建立模型。由于时间序列模型妥 善地解决了变量的非平稳性问题,从而为在经济领域应用时间序列模型奠定了理论基础。人们 发现耗费许多财力人力建立的经济计量模型有时竟不如一个简单的时间序列模型预测能力好 (Cooper 1972 年专门对两种模型的预测精度作了详细比较)。 此时,计量经济工作者面临三个亟待解决的问题: (1) 如何检验经济变量的非平稳性 (2) 如何把时间序列模型引入经济计量分析领域 (3) 如何进一步修改传统的经济计量模型 Dickey − F uller 1979 年首先提出检验时间序列非平稳性(单位根)的 DF 检验法,之后 又提出 ADF 检验法。 P hillips − P erron 1988 年提出 Z 检验法。这是一种非参数检验方法。 Sargan 1964 年提出误差修正模型概念。当初是用于研究商品库存量问题。Hendry − Anderson(1977) 和 Davidson(1978) 的论文进一步完善了这种模型,并尝试用这种模型解决非 平稳变量的建模问题。Hendry 还提出动态回归理论。 1980 年 Sims 提出向量自回归模型(V AR)。这是一种用一组内生变量作动态结构估计的 联立模型。这种模型的特点是不以经济理论为基础,然而预测能力很强。以上成果为协整理论 的提出奠定基础。 计量经济学发展的第三个里程碑是 1987 年 Engle − Granger 发表论文”协整与误差修正, 描述、估计与检验”。该论文正式提出协整概念,从而把计量经济学理论的研究又推向一个新 阶段。Granger 定理证明若干个一阶非平稳变量间若存在协整关系,那么这些变量一定存在误 差修正模型表达式。反之亦成立。1988 − 1992 年 Johansen (丹麦)连续发表了四篇关于向量 自回归模型中检验协整向量,并建立向量误差修正模型(V EC )的文章,进一步丰富了协整理 论。协整理论之所以引起经济计量学界的广泛兴趣与极大关注是因为协整理论为当代经济学的 发展提供了一种理论结合实际的强有力工具。 经 济 计 量 学 在 我 国 的 发 展 状 况 1960 年中国科学院经济研究所成立了一个经济数学方法研 究组。主要搞投入产出、优化研究。 -2- 第一章 前言 改革开放以后,1979 年三月成立了中国数量经济研究会(1984 年定名为中国数量经济学 会,并办有一份杂志,《数量经济技术经济研究》)。 1980 年中国数量经济学会首次举办经济计量学讲习班,邀请 Klein等七位美国教授讲课。 自此,计量经济学的教学与科研迅速展开,取得许多研究成果。国家信息中心为参加联合国 的”连接计划”研制了我国的宏观计量经济模型。吉林大学数量经济研究中心研制了”国家财政 模型及经济景气分析系统”。 1998 年教育部规定计量经济学是我国大学经济类专业本科学生的 8 门必修课之一。 思考 1.1 (什么是计量经济学) CC方 法 论 及 其 批 判 在计量经济学形成的早期,美国的投资家 A.Cowles 由于股市的崩溃 使他受到损失,从而激起他对计量经济学的兴趣而发起成立以自己名字命名的基金委员会(以 下简记为 CC),专门用于资助计量经济学的研究,在 CC 的资助下,形成了大量对计量经济学 具有奠基意义的成果,构建了计量经济学的概率论框架,因此经典计量经济学,在不严格的意 义下,又简称为 CC 方法论。 CC 方法论的假设: (1) 经济行为由联立方程所支配; (2) 模型的方程对变量和扰动项来说是线性的; (3) 变量是可观测且观测无误的 (4) 变量的预测值是离散的; (5) 外生变量和先决变量是设定的; (6) 联立应变量的系数行列式非零,使得简约形式存在; (7) 先决变量与扰动项线性独立; (8) 误差项一般独立同分布; (9) 通过对结构参数的约束使得结构方程可识别;(可识别的隐含假设) (10) 方程是动态稳定的。 (假定外生变量在重复抽样中固定,且当样本趋于无限时,外生变量的矩有限以及方程的特征 要的绝对值小于 1,即变量为 I0)当上述条件满足时,CC 方法论是完备而精确的方法论。 以 CC 方法论为主要内容的计量经济学常被称为经典计量经济学。针对 CC 方法论的批判 和取消或弱化 CC 方法论的假设而发展起来的计量经济学,即从 1960 后发展起来的,被称为 当代或高等计量经济学。 19 世纪 50 年代末期,由于石油危机引发了世界经济的衰退和随之而来的滞胀,以 CC 方 法论所构建的计量经济模型,几乎均未预测到这次经济的衰退。随后,基于经典计量经济方法 论所建立的模型也未能就治理滞胀开出有效的”药方”,由此导致了对 CC 方法论的批判,其中 Lucas(1976) 批判最具影响。Lucas 批判所隐含的意思为: 如果政策反应函数出现变化,这种变 化也将改变模型的参数,于是,联立模型的简约形式也将随之而变化,因此,使用联立模型所 作出的测预是不可信赖的。T.Sarget(1976) 以货币政策为例,重新解析了 Lucas 批判。他假定 货币政策体制从不变的货币增长政策改变为具有反馈的货币增长政策,因而,联立方程模型具 有 2 种简约形式,在常数的货币增长政策之下,简约参数并不随货币政策的改变而改变,而在 反馈的货币政策之下,简约参数随货币政策的改变而改变。于是,仅凭简约模型的估计并不能 解决哪一种货币政策好这一问题,因而,计量经济学对于评价政策似乎是无能为力的。 Lucas -3- 1.2 计量经济学的研究目的 是从计量经济学用于政策(而可能导致经济运行的改变)分析而提出的批判,其实质是提出了 参数是否随时间而变化的问题,隐含了经典计量经济模型产生不精确预测的重要原因是结构变 化问题。 Sims(1980)认为:为使结构方程可识别而施加了许多约束,这种约束是不可信的。因此, 他建议使用向量自回归(V AR)模型进行预测。随后大量的研究表明,利用 V AR 作预测, 其结果优于传统的联立系统所得到的结果。这种学术批判揭示了 CC 方法论直接或间接(隐 含)的假设为:①经济行为由联立方程所支配;②模型的方程对变量和扰动来说是线性的;③ 变量是可观测且观测无误差;④变量的观测值是离散的,即年度(月度)数据等;⑤外生变量 和先决变量是设定的;⑥联立应变量的系数行列式非零,使得简约形式存在;⑦先决变量与误 差(扰动)项线性独立;⑧误差项是独立同分布的正态变量,其均值为零,方差和协方差为常 数,协方差阵非奇异(这一假设实际上在 CC 方法论中已扩展为一般独立同分布扰动),⑨通 过对结构参数的约束使得结构方程可识别。⑩方程是动态稳定的。假设⑨⑩是间接的假设,其 中⑨是由可识别所隐含的假设,而⑩是最为关键的隐含假设,它通过假定外生变量在重复抽样 中固定,且当样本趋于无限时,外生变量的矩有限以及方程的特征根的绝对值小于 1(即变量 为 I(0))来实现方程的动态稳定性。我们以后可以看到,正是为取消这一条假设,直接导致了 特征根为 1 即变量为单位根过程的研究。 针对 CC 方法论的批判和取消或弱化 CC 方法论的假设而发展起来的计量经济学,即从 19 世纪 60 年代之后发展起来的计量经济学,被称之为当代(高等)计量经济学。 方法论 历程 大致内容有: (1) CC 成员 T.Haavelmo 证明,标准的OLS运用于联立模型中的单个方程,将产生有偏估 计。 (2) Haavelmo,1943,首先提出了间接最小二乘估计。 (3) T Koopmans,1949,定义并解决了识别问题。 (4) Koopmans ,Rubin,Leipnik 等发展了完全信息的极大似然估计。 (5) Lucas,1976,卢卡斯批判:使用计量经济模型预测未来经济政策的变化所产生的效用是 不可信的。卢卡期批判是从计量经济学用于政策分析而提出的,其实质是提出了参数是否 随时间而变化的问题,隐含了 CLM 产生不精确预测的重要原因是结构变化问题。 (6) Sims,1980,认为:为使结构方程可识别而施加了许多约束,这种约束是不可信的。因 此,他建议使用向量自回归而回避结构约束问题。从预测结果看,V AR 优于结构联立方 程系统,且规模较小。 1.2 计量经济学的研究目的 1.定量描述与分析经济活动,验证经济理论。包括描述宏观、微观经济问题。 2.寻找经济规律、建立经济计量模型,为制定经济政策服务。通过计量模型得到参数(边 际系数,弹性系数,技术系数,比率,速率等)的可靠估计值,从而为制定政策,实施宏观调 控提供依据 3.做经济预测。这是经济计量学利用模型所要解决的最重要内容,也是最困难的内容。经 济计量学的发展史就是谋求对经济变量做出更精确预测的发展史。这要求(1)变量选择要准 确,(2)模型形式要合理。 1.3 计量经济模型及其应用 计量经济模型 -4- 第一章 前言 定义 1.1 (模型) 模型,是对现实的描述和模拟。对现实的各种不同的描述和模拟方法, 就构成了各种不同的模型,例如,语义模型(也称逻辑模型)、物理模型、几何模型、数学模 型和计算机模拟模型等。 (1) 语义模型是用语言来描述现实,例如,对供给不足下的生产活动,我们可以用”产出量是 由资本、劳动、技术等投入要素决定的,在一般情况下,随着各种投入要素的增加,产出 量也随之增加,但要素的边际产出是递减的”来描述。 (2) 物理模型是用简化了的实物来描述现实,例如,一栋楼房的模型,一架飞机的模型。 (3) 几何模型是用图形来描述现实,例如一个零部件的加工图。 (4) 计算机模拟模型是随着计算机技术而发展起来的一种描述现实的方法,在经济研究中有广 泛的应用,例如人工神经元网络技术就是一种计算机模拟技术。 (5) 数学模型是用数学语言描述现实,也是一种重要的模型方法,它能够揭示现实活动中的数 量关系。 定义 1.2 (经济数学模型) 经济数学模型是用数学方法描述经济活动。根据所采用的数学 方法不同、对经济活动揭示的程度不同,构成各类不同的经济数学模型。 定义 1.3 (数理经济模型) 数理经济模型揭示经济活动中各个因素之间的理论关系,用确 定性的数学方程加以描述。利用数理经济模型,可以分析经济活动中各种因素之间的互相影 响,为控制经济活动提供理论指导。但是,数理经济模型并没有揭示因素之间的定量关系。 定义 1.4 (计量经济模型) 机性的数学方程加以描述。 计量经济模型揭示经济活动中各个因素之间的定量关系,用随 计量经济方法的基本过程 (1) 经济理论 (2) 理论的数学模型 (3) 理论的计量经济学模型 (4) 数据的收集整理 (5) 计量经济模型的参数估计 (6) 假设检验 (7) 预报和预测 (8) 控制或政策制定 计量经济模型的应用 思考 1.2 (计量经济模型有什么用途?) 结 构 分 析 是对经济现象中变量之间相互关系的研究,研究的是当一个变量或几个变量发 生变化时会对其它变量以至经济系统产生什么样的影响。结构分析所采用的主要方法是弹性分 析、乘数分析与比较静力分析。 弹性,是经济学中一个重要概念,是某一变量的相对变化引起另一变量的相对变化的度 量,即是变量的变化率之比。 -5- 1.4 计量经济学的内容体系 乘数,也是经济学中一个重要概念,是某一变量的绝对变化引起另一变量的绝对变化的度 量,即是变量的变化量之比,也称倍数。 比较静力分析,是比较经济系统的不同平衡位置之间的联系,探索经济系统从一个平衡点 到另一个平衡点时变量的变化,研究系统中某个变量或参数的变化对另外变量或参数的影响。 经 济 预 测 计量经济学模型是以模拟历史、从已经发生的经济活动中找出变化规律为主要技 术手段。对于非稳定发展的经济过程,对于缺乏规范行为理论的经济活动,计量经济学模型预 测功能失效。 政 策 评 价 政策评价是指从许多不同的政策中选择较好的政策予以实行,或者说是研究不同 的政策对经济目标所产生的影响的差异。 计量经济学模型用于政策评价,主要有三种方法。一是工具-目标法。给定目标变量的预期 值,即我们希望达到的目标,通过求解模型,可以得到政策变量值。二是政策模拟。即将各种 不同的政策代入模型,计算各自的目标值,然后比较其优劣,决定政策的取舍。三是最优控制 方法。将计量经济学模型与最优化方法结合起来,选择使得目标最优的政策或政策组合。检 检验 与 发 展 经 济 理 论 计量经济学模型的两方面功能。一是按照某种经济理论去建立模型,然后用 表现已经发生的经济活动的样本数据去拟合,如果拟合很好,则这种经济理论得到了检验。这 就是检验理论。二是用表现已经发生的经济活动的样本数据去拟合各种模型,拟合最好的模型 所表现出来的数量关系,则是经济活动所遵循的经济规律,即理论。这就是发现和发展理论。 1.4 计量经济学的内容体系 广义计量经济学是利用经济理论、数学以及统计学定量研究经济现象的经济计量方法的统 称,包括回归分析方法、投入产出分析方法、时间序列分析方法等。 狭义计量经济学,也就是我们通常所说的计量经济学,以揭示经济现象中的因果关系为目 的,在数学上主要应用回归分析方法。 初级以计量经济学的数理统计学基础知识和经典的线性单方程模型理论与方法为主要内 容; 中级以用矩阵描述的经典的线性单方程模型理论与方法、经典的线性联立方程模型理论与 方法,以及传统的应用模型为主要内容; 高级以非经典的、现代的计量经济学模型理论、方法与应用为主要内容。学 学科 角 度 (1) 经典计量经济学,以经济理论为导向,以揭示经济现象中的因果关系为目的,以线性随机 方程为理论形式,主要应用回归分析方法估计模型。 (2) 广义计量经济学,利用经济理论、数学以及统计学定量研究经济现象的经济计量方法的统 称。它既包括几乎与经典的计量经济学同时发展的投入产出分析方法、时间序列分析方法 等,也包括近30年来发展的许多新的计量经济学理论方法。 内容角度 (1) 理论计量经济学 (2) 应用计量经济学 模 型 类 型 从模型类型角度,可以将计量经济学模型划分为经典线性模型、非经典线性模型、 非线性模型、动态模型和无参数回归模型等。 (1) 经典线性模型是以揭示经济现象中的因果关系为目的、在数学上主要应用回归分析方法的 线性模型。 -6- 第一章 前言 (2) 非经典线性模型是经典线性模型在模型结构方面的扩展。例如由经典的常参数线性模型扩 展的变参数线性模型;由反映变量之间因果关系的经典线性模型扩展为并不反映因果关系 的线性模型,诸如著名的MA、AR、ARMA等时间序列分析模型和线性增长模型;由根 据经济理论和经济行为规律设定的经典线性模型扩展为根据对数据的协整分析而设定的误 差修正模型;等等。 (3) 非线性模型是一类用非线性方程描述经济变量之间的非线性关系的经济数学模型,包括非 线性单方程模型和非线性联立方程模型。非线性模型由于其估计方法的复杂性,构成了高 级计量经济学的主要内容。 (4) 这里的动态模型是专指以英国计量经济学家D.F.Hendry为代表的学派所倡导的宏观计量 经济模型。Hendry认为,在50至60年代,计量经济学的主导方法论是”结构模型方法”, 即以先验给定的经济理论为建立模型的出发点,以模型的参数估计为重心,以参数估计值 与其理论预期值相一致为判断标准。这种方法论在70年代后遇到了挑战,所以必须发展新 的宏观计量经济模型方法论。在本书中将对它们进行详细的介绍。 (5) 无参数回归模型,顾名思义,这类模型没有明确的函数关系,所以也没有明确的待估参 数,只有解释变量和被解释变量以及它们的样本观测值。无参数模型的提出是基于这样的 认识:每个参数模型都隐含着一系列的经济学假设,例如C-D生产函数模型的中性技术进 步假设、替代弹性不变假设等,而这些假设在实际上是无法满足的,所以参数模型中给定 的函数关系实际上是不可靠的。无参数模型利用其适当的估计方法,通过样本观测值,找 出被解释变量的变化规律。例如常用的权函数估计,就是通过样本观测值确定权重,将被 解释变量的估计描述为被解释变量样本观测值的加权和。由于无参数模型最终也不能给出 解释变量和被解释变量之间的结构关系,它在理论计量经济学中的意义大于其实用价值。 估计方法角度 最 小二 乘 法 是经典线性计量经济学模型的最主要的估计方法。例如,在经典线性计量经济学 模型满足基本假设时采用的普通最小二乘法,在经典线性计量经济学模型存在异方差性时 采用的加权最小二乘法,在经典线性计量经济学模型存在序列相关性时采用的广义最小二 乘法,在经典线性计量经济学模型存在随机解释变量时采用的工具变量方法,估计经典线 性联立方程计量经济学模型的二阶段最小二乘法、三阶段最小二乘法,等等。 最 大似 然 法 在经典线性计量经济学模型中,存在着一个与最小二乘方法对应的最大似然方法 系列,例如与普通最小二乘法对应的最大似然法,与二阶段最小二乘法对应的有限信息最 大似然法,与三阶段最小二乘法对应的完全信息最大似然法。 贝 叶斯 估 计方 法 主要特点是利用了非样本信息,即前验信息与后验信息。 广 义矩 方 法 广 义 矩 (GM M, GeneralizedM ethodof M oments) 方 法 是 矩 方 法 (M M, M ethodof M oments) 的 一 般 化 , 也 是 一 类 依 赖 样 本 信 息 的 参 数 估 计 方 法。一般地,被解释变量的各阶原点矩是待估参数的函数。利用样本数据计算各阶原点矩 的估计量,最简单的例如一阶原点矩(即期望)的估计量、二阶原点矩(即方差)的估计 量;然后利用该估计量,求解关于待估参数估计量的各阶矩方程,以得到参数估计量。广 义矩方法有其广泛的适用性,普通最小二乘法、最大似然法等都可以看成是它的特例。 数据角度 截面数据分析 时序数据分析 -7- 1.4 计量经济学的内容体系 平 行数 据 分析 P anelData 离 散被 解 释变 量 数据 分 析 M odelwithDiscretedependentV ariable,如 P robit 模型和 Logit 模 型 受 限被 解 释变 量 数据 分 析 LimitedDependentV ariable,仅指模型的被解释变量的样本数据是 受到某种限制 持 续被 解 释变 量 数据 分 析 DurationM odel,指模型的被解释变量的样本观测值是事件持续的 期间长度 经 典 计 量 经 济 学 经典计量经济学(ClassicalEconometrics)一般指 20 世纪 70 年代 以前发展并广泛应用的计量经济学。由 R.F rish 创立,T.Haavelmo 建立了它的概率论基 础,L.R.Klein 成为其理论与应用的集大成者。 经典计量经济学在理论方法方面特征是:⑴模型类型―随机模型;⑵模型导向―理论导 向;⑶模型结构―线性或者可以化为线性,因果分析,解释变量具有同等地位,模型具有明确 的形式和参数;⑷数据类型―以时间序列数据或者截面数据为样本,被解释变量为服从正态分 布的连续随机变量;⑸估计方法―仅利用样本信息,采用最小二乘方法或者最大似然方法估计 模型。 经典计量经济学在应用方面的特征是:⑴应用模型方法论基础―实证分析、经验分析、归 纳;⑵应用模型的功能―结构分析、政策评价、经济预测、理论检验与发展;⑶应用模型的领 域―传统的应用领域,例如生产、需求、消费、投资、货币需求,以及宏观经济等。 非 经 典 计 量 经 济 学 非经典计量经济学一般指20世纪70年代以来发展的计量经济学理论、方 法及应用模型,也称为现代计量经济学。 非经典计量经济学主要包括:微观计量经济学、非参数计量经济学、时间序列计量经济学 和动态计量经济学等。 非经典计量经济学的内容体系:模型类型非经典的计量经济学问题、模型导向非经典的计 量经济学问题、模型结构非经典的计量经济学问题、数据类型非经典的计量经济学问题和估计 方法非经典的计量经济学问题。 微 观 计 量 经 济 学 微观计量经济学于 2000 年诺贝尔经济学奖公报中正式提出。微观计量经 济学的内容集中于“对个人和家庭的经济行为进行经验分析”;“微观计量经济学的原材料是 微观数据”,微观数据表现为截面数据和平行( penal)数据。赫克曼( J.Heckman)和麦克 法登( D.M cF addan)对微观计量经济学作出原创性贡献。 微观计量经济学的主要内容包括:平行数据模型的理论方法;离散选择模型的理论方法; 选择性样本模型的理论方法。 宏 观 计 量 经 济 学 宏观计量经济学名称由来已久,但是它的主要内容和研究方向发生了变 化。经典宏观计量经济学:利用计量经济学理论方法,建立宏观经济模型,对宏观经济进行分 析、评价和预测。现代宏观计量经济学的主要研究方向:单位根检验、协整理论以及动态计量 经济学。 -8- 第二章 估计方法引论 第二章 估计方法引论 2.1 德尔塔方法 计量经济学家经常希望对模型参数的非线性函数进行推断,因此要求对参数估计非线性函 数的标准差进行估计,或者更一般地,对这种函数向量的协方差矩阵进行估计。一种常用方法 是以渐近近似为基础的所谓的德 德尔 塔 方 法 。 假 设 已 估 计 出 参 数 θ, 它 可 能 是 一 个 线 性 回 归 模 型 参 数 。 我 们 感 兴 趣 的 是 参 数 γ = g(θ),g()˙ 是连续可导的单调函数。在这种情况下,估计 γ 的方法是利用关系 γ̂ = g(θ̂)。 对于 g(θ) 是线性函数或仿射函数的情况,我们看如何计算 V ar(γ̂)。假定 γ = W T θ,则 γ̂ = W T θ̂: V ar(W T θ̂) = E(W T (θ̂ − θ)(θ̂ − θ)T W ) = W T E((θ̂ − θ)(θ̂ − θ)T )W = σ 2 W T (X T X)−1 W 德尔塔方法是想找出 g(θ) 的一个线性近似,然后应用上面这个结论。 非线性函数进行线性近似的常用数学工具是泰 泰勒 定理 。它的最简单形式为中 中值 定 理 : f (b) − f (a) f 0 (x) = b−a f (a + h) = f (a) + hf 0 (a + λh) (2-1) 直到 h 的 p 次方的泰勒定理可表述为: f (a + h) = f (a) + p−1 i X h i=1 i! f (i) (a) + hp 0 f (a + λh) p! 最常用的是二阶泰勒展开: 2 h f (a + h) ∼ = f (a) + hf 0 (a) + f 0 (a) 2 两种形式都要求一个正则条件:f (x) 在 [a, a + h] 上的 p 阶导数连续。 √ 假定参数估计 θ̂ 是 n 一致和渐近正态的,则 1 n 2 (θ̂ − θ0 ) → N (0, V (θ̂)) (2-2) 对 g(θ̂) 在 θ0 附近进行泰勒展开: γ̂ ∼ = g(θ0 ) + g‘(θ0 )(θ̂ − θ0 ) (2-3) 两个确定性量称为渐 渐近 相 等 当且仅当 n → ∞ 时它们具有相同的极限。类似地,两个随机变量 称为渐近相等的当且仅当它们以概率趋于相同的极限。通常我们需要因子 n 的适当次幂以使推 导能够顺利进行。对上式两边乘以 n1/2 : n1/2 (γ̂ − γ0 )ag‘(θ0 )n1/2 (θ̂ − θ0 ) (2-4) 由上式立即可以导出估计 γ̂ 标准误差的一个实用方法: ¯ ¯ ¯ 0 ¯ Sγ ≡ ¯g (θ̂)¯ Sθ (2-5) 2.2 修正的普通最小二乘估计 修正的普通最小二乘估计(COLS )是 Richmand 于 1974 年首先提出的在普通最小二乘估 计结果的基础上对常数项进行修正的一种估计方法 -9- 2.3 普通最小二乘估计 用修正的普通最小二乘法估计确定性统计边界生产函数模型,即是首先用最小二乘法估计 平均生产函数,然后计算所有样本点的产出量的观测值与平均生产函数估计值之差,取其最大 者加到平均生产函数的常数项上,即得到边界生产函数的常数项,进行而得到边界生产函数。 Y = AK α Lβ e−u ln Y = ln A + α ln K + β ln L − u ln Ŷ = (â − û) + α̂ ln K + β̂ ln L û = max(ln Yi − ln Ŷ ) ln Y ∗ = û + ln Ŷ 2.3 普通最小二乘估计 残差平方和最小: Q= n X (Yi − Ŷi )2 (2-6) i=1 得出参数估计量: " # β̂0 β̂1 · ¸ P ¸−1 · P T xt yt P = P P 2 xt xt xt yt · P 2 ¸ P ¸· P 1 xt − xt yt P P P = P 2 T xt yt T xt − ( xt )2 − xt (2-7) 2.4 广义最小二乘估计 Feasible Generalized Least Squares 对于模型 Y = XB + N (2-8) 如果存在序列相关和异方差 E(N) = 0 Cov(NN0 ) = E(NN0 ) = σ 2 Ω w1 w12 · · · w1n w21 w2 · · · w2n Ω= = DD0 . . . (2-9) wn1 wn2 · · · wn 用 D−1 左乘方程 D −1 Y = D −1 XB + D −1 N (2-10) Y ∗ = X ∗ B + N∗ (2-11) 可改写为 它具有无序列相关及无异方差的特性。如果 Ω 已知,可以用 OLS 法得出参数估计量。如果 Ω 未知,则需要进行估计: (2-12) B̂ = (X 0 Ω̂−1 X)−1 X 0 Ω̂−1 Y 这个估计量称为 F GLS 估计量。 - 10 - 第二章 估计方法引论 一般地,Ω 可能包括某些参数 θ。如模型存在一阶自相关时,有 1 ρ · · · ρn−1 ρ 1 · · · ρn−2 Ω= . . . . .. . . .. .. ρn−1 ρn−2 · · · 1 (2-13) 如果能够得到参数 θ 的一致估计,则 Ω 的 F GLS 估计量是渐近等价的。 对于 Ω 的估计,可以先用 OLS 法估计模型,得出误差项估计量,然后以其作为 Ω 的估 计: 2 ẽ1 ẽ1 ẽ2 · · · ẽ1 ẽn ẽ2 ẽ1 ẽ2 · · · ẽ2 ẽn 2 Ω̂ = . (2-14) . . . .. . . .. .. ẽn ẽ1 ẽn ẽ2 · · · ẽ2n 2.5 分部回归法 Partitioned Regression 将解释变量分成两部分,对应的参数也分成两部分 Y = X 1 B1 + X 2 B2 + N 在解释变量和误差项不相关的情况下 # · 0 ¸ · 0 ¸" X 1Y B̂1 x 1 x1 x0 1 x2 = X 02Y x0 2 x1 x0 2 x2 B̂2 (2-15) 估计参数 B̂1 = (X 0 1 X 1 )−1 X 0 1 Y − (X 0 1 X 1 )−1 X 0 1 X 2 B̂2 = (X 0 1 X 1 )−1 X 0 1 (Y − X 2 B̂2 ) (2-16) 如果 X 01X 2 = 0 则 B̂1 = (X 0 1 X 1 )−1 X 0 1 Y 同理, B̂2 = (X 0 2 X 2 )−1 X 0 2 Y 结论:如果两组解释变量是正交的,那么相应的参数估计量可以分别在仅以一部分变量为解释 变量的情况下加以估计。再进一步,如果模型的所有解释变量都是互相正交的,那么可以将多 元线性模型化成若干个一元模型加以分别估计。这就是所谓的”分部回归估计”。当然,上述两 组解释变量是完全正交的情况在实际中是很难发现的,或者说是不可能出现的。所以,”分部 回归估计”并没有实际意义。在应用主分量法时 在经典计量经济学模型中,读者已经很熟悉如下问题:一是当模型中某些变量被检验为不 显著时,就要将这些变量从模型中剔除;二是当发现解释变量出现多重共线性时,一个有效的 处理方法是从模型中去掉产生多重共线性的部分变量。这些无疑是可行的。但是,值得注意的 是,由于模型原有的变量之间并不是正交的,所以当剔除部分变量后,所保留变量的参数估计 值将发生变化,它所反映的不再仅仅是该变量与被解释变量之间的关系。这一点从分部回归中 得到了证明。于是,它提醒人们,不能轻易剔除”不显著”的变量,除非它的显著性低到对被解 释变量几乎没有影响。更不能轻易采用剔除变量的方法消除多重共线性,应该多采用差分法或 主分量法等。 - 11 - 2.6 偏回归估计 Partial Regression 2.6 偏回归估计 Partial Regression 由分部回归内容 X 0 2 Y = X 0 2 X 1 B̂1 + X 0 2 X 2 B̂2 得 X 0 2 Y = X 0 2 X 1 ((X 0 1 X 1 )−1 X 0 1 Y − (X 0 1 X 1 )−1 X 0 1 X 2 B̂2 ) + X 0 2 X 2 B̂2 = X 0 2 X 1 (X 0 1 X 1 )−1 X 0 1 Y − X 0 2 X 1 (X 0 1 X 1 )−1 X 0 1 X 2 B̂2 + X 0 2 X 2 B̂2 推导 X 0 2 (I − X 1 (X 0 1 X 1 )−1 X 0 1 )Y = X 0 2 (I − X 1 (X 0 1 X 1 )−1 X 0 1 )X 2 B̂2 有 (X 0 2 (I − X 1 (X 0 1 X 1 )−1 X 0 1 )X 2 )−1 X 0 2 (I − X 1 (X 0 1 X 1 )−1 X 0 1 )Y = B̂2 令 (I − X 1 (X 0 1 X 1 )−1 X 0 1 ) = M 成立 B̂2 = (X 0 2 M X 2 )−1 (X 0 2 M Y ) 因为 M 是等幂矩阵 B̂2 = (X 0 2 M 0 M X 2 )−1 (X 0 2 M 0 M Y ) = (X ∗2 X ∗2 )−1 (X ∗2 Y ∗ ) 其中 Y ∗ = M Y = (I − X 1 (X 0 1 X 1 )−1 X 0 1 )Y = Y − X 1 (X 0 1 X 1 )−1 X 0 1 Y 是 Y 仅以 X 1 为解释变量建立的模型的残差。 以 X 2 对 X 1 回归: 得出残差 X̂ 2 = X 1 ((X 0 1 X 1 )−1 X 0 1 X 2 ) X 2 − X̂ 2 = X 2 − X 1 ((X 0 1 X 1 )−1 X 0 1 X 2 ) = (I − X 1 (X 0 1 X 1 )−1 X 0 1 )X 2 = M X2 (2-17) = X ∗2 2.7 两阶段最小二乘 定义 2.1 (排斥性约束) 假定结构模型 y1 = β0 + β1 y2 + β2 z1 + u1 有一个内生解释变量 y2 和一个外生解释变量 z1 。假定现在我们有两个被排斥在该式之外的外 生变量 z2 和 z3 。它们不出现该式,且与误差项不相关的诸假定称为 exclusionrestriction。 外生变量的任何线性组合都是有效的 IV 。为寻找最好的 IV ,我们选择与 y2 最高度相关的 线性组合。这正是由 y2 的诱 诱导 型 方程 reducedf ormequation 所给出的: y2 = φ0 + φ1 z1 + φ2 z − 2 + φ3 z3 + v2 获得 OLS 估计值 ŷ2 ,用它做为 y2 的 IV 。在复工具条件下,IV 估计量也叫做两 两阶 段 最 小 二 乘 估 计 量 twostageleastsquaresestimator。如果 z2 和 z3 在上式中不是联合显著的,做 IV 估 计是在浪费时间。 - 12 - 第二章 估计方法引论 2.8 交叉估计方法 Across Regression 交叉估计也是对模型参数进行部分回归的一种估计方法,但是与上述部分回归估计不同的 是,它将模型的参数按照其性质分类,然后分别用不同的样本观测值,包括被解释变量的样本 观测值,估计各类参数。那么自然地,它只是相对于某类应用模型而言。问 问 题 的 提 出 在需求 函数模型中,解释变量一般为收入和价格,这两类变量对商品需求量的影响是不同的。按照协 整理论,商品需求量和收入为流量指标,一般情况下为一阶单整,它们之间可能存在协整关 系,反映了二者之间的长期关系;而价格水平一般是 0 阶单整,它对商品需求量具有短期影 响。从直观上也可以看出,收入对商品需求量具有长期影响,价格对商品需求量只具有短期影 响。它们的参数分别属于长期弹性和短期弹性,具有不同的性质。而一般说来,时间序列数据 适合于短期弹性的估计,截面数据适合于长期弹性的估计。所以用同一组样本数据同时估计需 求函数模型的所有参数,在理论上是存在问题的。 于是就提出了合并时间序列数据和截面数据的估计方法,即交叉估计方法。即用截面数据 为样本估计模型中的一部分反映长期影响的参数,然后再用时间序列数据为样本估计模型中的 另一部分反映短期影响的参数,分两阶段完成模型的估计。 为什么时间序列数据适合于短期弹性的估计,而截面数据适合于长期弹性的估计?结合需 求函数模型来看:在截面上,由于价格并不随收入而显著变化,所以对商品需求量起作用的是 收入;而且,在同一截面上,不同的消费者的收入差距可能相当大,使得收入的样本观测值数 据变化较大。两者综合,说明收入对需求量的影响适宜于用截面数据估计。如果用时间序列数 据,由于收入随时间的变化是缓慢的,不同时间的收入的样本观测值数据变化较小,不宜于揭 示收入对需求量的长期影响。反过来,价格的时间序列数据适宜于揭示价格对需求量的短期影 响。 交叉估计不仅适于需求函数模型的估计,也适用于包含长期影响和短期影响两类解释变量 的其它模型的估计。例如居民储蓄方程。居民新增储蓄由收入水平和利率决定,其中收入水平 具有长期影响,利率具有短期影响,适合于用交叉估计方法进行分析。再如税收方程,以税基 和税率为解释变量,也适合于用交叉估计方法进行估计 估 计 方 法 以对数线性需求函数为例,为了简化,假设解释变量中只包括收入和自价格。对 数线性需求函数为: ln q = α0 + α1 ln I + α2 ln p + µ 现有某一年的截面数据,在这个截面上,价格是常数。按收入分组: ln qj = a + α1 ln Ij + µj j = 1, 2, · · · , m 采用经典线性单方程模型的估计方法估计得到 α̂1 。 当以时间序列数据为样本时,将模型写成: ln qt = α0 + α1 ln It + α2 ln pt + µt 令 yt = ln qt − α̂1 ln It 有 yt = α0 + α2 ln pt + µt 采用经典线性单方程模型的估计方法估计得到全部参数。 在截面分析时,样本观测值取自分组人均数据,而在时序分析时,样本观测值一般取总体 平均数据,这里存在一致性问题。另外,采用的年份不同,得到的 α̂1 估计量也不同,这里存 在一个任意性问题。所以,交叉估计作为一种实用方法,尚缺少理论计量经济学的支持。 - 13 - 2.9 最大似然估计方法 2.9 最大似然估计方法 回归模型的普通的、非线性的、广义最小二乘和工具变量以及 GM M 都可以从矩方法中得 出。这里引入另一种基本估计方法:极大似然方法。在回归模型误差项正态分布的假设下,极大 似然估计量,简称 M L 估计量,与我们熟悉的各种最小二乘估计量相同。M L 估计量的主要缺 点是它比矩方法要求更强的分布假设。 最 大 似 然 估 计 原 理 对于最小二乘法,当从模型总体随机抽取 n 组样本观测值后,最合理 的参数估计量应该使得模型能最好地拟合样本数据。而对于最大或然法,当从模型总体随机抽 取 n 组样本观测值后,最合理的参数估计量应该使得从模型中抽取该 n 组样本观测值的概率最 大。 极大似然方法估计的模型必须是完 完全 设 定 模 型 。 定义 2.2 (完全设定模型) 完全设定模型是能够给出明确算法的模型,即只要知道模型参 数值就能模拟出因变量值。任何一个完全设定的计量经济模型必须为计算机模拟提供一个明确 的算式,如果能够利用模型产生模拟数据,该模型一定是完全设定的。 对于这样的模型,一旦参数值给定,则我们就具有模拟因变量所需要的所有信息。要对因变量 进行模拟,必须知道其 P DF ,即要知道将每个观测看作随机变量的 P DF ,还要知道将所有样 本看作随机向量时的联合 P DF 。 在很多情况下,样本观测假定为统计独立的。因此,整个样本的联合分布等于各个观测密 度的乘积: n Y f (y, θ) = f (yt , θ) (2-18) t=1 习惯上采用对数似然函数。 M L 估计量与 M M 估计量相同的情况十分普遍。但 M L 的一个优势是不需要求期望值。 另外,如果一个估计量是 M LE ,它将具有很多理想的渐近性质,这些性质使得标准误差的计 算和检验统计量的计算更加容易。 我们首先讨论极大似然方法用于古典正态线性模型 Y = Xβ + U U ∼ N (0, σ 2 I) X 外生 因此 X 条件下,Y 服从 N (Xβ, σ 2 )。Yt 的 P DF 为: 1 (yt − Xt β)2 ft (yt , β, σ 2 ) = √ EXP (− 2σ 2 σ 2π 对数似然函数等于所有观测贡献的和: n n 1 ι(y, β, σ) = − log 2π − log σ 2 − 2 (y − Xβ)T (y − Xβ) 2 2 2σ (2-19) (2-20) (2-21) 关于未知参数 β 和 σ 对上式求极大值得出 M L 估计量。第一步是关于参数 σ 对 ι(y, β, σ) 求极大值。将对数似然函数对 σ 求导,将导数看作数据和其他参数的函数,从一阶 条件中解出 σ 并回代到对数似然函数中。这样得到的似然函数称为集中似然函数 concentratedloglikelihoodf unction。第二步关于 β 对这个函数求极值。从推导中可以看出,极 大化集中对数似然函数等价于极小化残差平方和函数(关于 β 的函数)。M L 估计量必定等于 OLS 估计量。β 的 M L 估计量等于 OLS 估计量依赖于误差项的正态分布假设。从不同的分布 假设出发,可以得到不同的 M L 估计量。 M L 估计量有两种定义: 第 一类 M L 估计 量 在集合 Θ (参数 θ 取值的参数空间)上极大化对数似然函数得出的估计量。 - 14 - 第二章 估计方法引论 第 二类 M L 估计 量 定义为似然方程的解,似然方程是一阶条件 g(y, θ̂) = 0。其中,g(y, θ) 是 梯 度向 量,或者称为得 得分向 量 。其代表元素为 n ∂ι(y, θ) X ∂ι(yt , θ) gi (y, θ) ≡ = ∂θi ∂θi t=1 极大似然估计往往很容易计算。得不到直接表达式时,同其他情形一样,必须采用非线性 极大化程序。牛顿法和拟牛顿法经过少许修改就可以用于 M L 估计。牛顿法的基本方程是: −1 θ(j+1) = θj − H(j) g(j) (2-22) 拟牛顿法的公式是: −1 θ(j+1) = θj + αD(j) g(j) (2-23) M L 估 计 量 的 渐 近 性 质 在相当弱的条件下,M L 估计量是一致的,在稍强一些的假设下 是渐近正态的。 一致性的证明:首先证明在参数真值处取值的对数似然函数的期望大于在其他处取值的期 望。要证明一致性,还需要有限样本下的可识别条件和渐近可识别条件。 定理 2.1 (Jensen 不等式) 如 果 X 是 一 个 实 值 随 机 变 量 ,h()˙ 是 一 个 凹 函 数 , 则 E(h(X) ≤ h(E(X))。当 h()˙ 至少在随机变量 X 的支撑的一部分上是严格凹的,则严格不 等式成立。所谓支 支撑 是指一个实数集合,X 的密度在这个集合上不为零,支撑包含的点要多于 一个。 将这个不等式应用于比值 L(θ∗ )/L(θ0 ),其中 θ0 是参数真值,θ∗ 为模型参数空间中的任意一个 向量。因为对数似然函数是非负实数上的严格凹函数,并且似然函数是非负函数,从詹森不等 式得出: L(θ∗ ) L(θ∗ ) E0 log < log E0 (2-24) L(θ0 ) L(θ0 ) E0 表示在参数向量 θ0 刻画的 DGP 下取期望。右边的期望可以用随机向量 y 支撑上的积分表 示: Z L(θ∗ ) L(θ∗ ) E0 = L(θ0 )dy = 1 L(θ0 ) L(θ0 ) 从而有 L(θ∗ ) = E0 ι(θ∗ ) − E0 ι(θ0 ) < 0 E0 log L(θ0 ) (再对对数似然函数应用大数定律。)它可以得出: 1 1 p lim ι(θ∗ ) ≤ p lim ι(θ0 ) n→∞ n n→∞ n (2-25) (2-26) 对所有的 θ∗ 6= θ0 成立,因为极限中的不等式不一定是严格的。因为 M LE 是极大化 ι(θ): 1 1 p lim ι(θ̂) ≥ p lim ι(θ0 ) (2-27) n→∞ n n→∞ n 两个不等式同时成立说明: 1 1 p lim ι(θ̂) = p lim ι(θ0 ) n→∞ n n→∞ n 一 致 性 的 证 明 还 需 要 满 足 渐 近 可 识 别 条 件:对 所 有 θ∗ 6= θ0 , 都 有plimn−1 ι(θ∗ ) 6= plimn−1 ι(θ0 )。 考虑不独立模型的似然函数和对数似然函数的构建,如当回归函数中包括滞后因变量的情 形。对于一个用极大似然方法估计的模型,密度函数依赖于 k 维向量参数 θ: n Y n f (y , θ) = f (yt |y t−1 ; θ) (2-28) t=1 - 15 - 2.9 最大似然估计方法 其中每个观测的边际密度用条件密度代替。对应的对数似然函数具有和式的形式: n X n ι(y , θ) = ιt (y t , θ) (2-29) t=1 其中省略了表示整体样本的 y 的上标。 定义表明,梯度向量的每个分量是 n 个贡献之和,当观测不独立仍然正确;但 ιt 关于 θi 的 偏导数依赖于 y t 而不再仅仅是 yt 。将这些偏导数写成一个矩阵会带来方便。定义 n × k 矩阵 G(y, θ),其代表性元素为: ∂ιt (y t , θ) t Gti (y , θ) ≡ (2-30) ∂θi 这个矩阵称为梯 梯度 贡 献矩 阵 。因为: gi (y, θ) = n X Gti (y t , θ) (2-31) t=1 因此,梯度向量的每个分量都是矩阵 G(y, θ) 向量的元素的和。G(y, θ) 的一个关键性质是,如 果 y 是由 θ 有 限 信 息 最 大 似 然 法 有 限 信 息 最 大 似 然 法 (LIM L, LimitedInf ormationM aximumLikelihood) 是 一 种 以 最 大 似 然 为 准 则 、 通 过 对 简化式模型进行最大似然估计,以得到结构方程参数估计量的联立方程模型的单方程估计方 法。由 Anderson 和 Rubin 于 1949 年提出,早于两阶段最小二乘法。适用于恰好识别和过度 识别结构方程的估计。 在该方法中,以下两个概念是重要的:一是这里的”有限信息”指的是每次估计只考虑一个 结构方程的信息,而没有考虑模型系统中其它结构方程的信息;二是这里的”最大似然法”是针 对结构方程中包含的内生变量的简化式模型的,即应用最大似然法求得的是简化式参数估计 量,而不是结构式参数估计量。 BY + ΓX = N 每一个方程(以第一个方程为例)可以改写为如下的形式: Y1 = β12 Y2 + β13 Y3 + · · · + β1g1 Yg1 + γ11 X1 + γ12 X2 + · · · + γ1k1 Xk1 + N1 用矩阵形式表达是: µ Y1 = (Y 0 , X 0 ) 其中 B0 Γ0 ¶ + N1 y21 y31 · · · yg1 1 yg1 2 ¤ £ y22 y32 Y 0 = Y2 Y3 · · · Yg1 = . . .. . . . . . y2n y3n yg1 n x11 x21 · · · xk1 1 h i x12 x22 xk1 2 X 0 = X1 X2 · · · X k = . . . .. .. 1 .. β12 β13 B0 = . . . x1n x2n γ11 γ12 Γ0 = . . . β1g1 γ1k1 - 16 - xk1 n 第二章 估计方法引论 y11 y12 Y1 = . .. µ11 µ12 N1 = . .. y1n 第一个结构方程可以表示为 µ1n µ (Y 10 , X 0 ) B10 Γ0 ¶ + N1 = 0 其中 µ Y 10 = (Y1 , Y 0 ) B10 = −1 B0 ¶ 该方程包含的内生变量的简化式模型为: Y 10 = XΠ10 + E10 其对数似然函数: Ln L(Y 10 ) = c + n ¯¯ −1 ¯¯ 1 1 1 0 1 1 ln Ω0 − tr(Ω−1 0 )(Y 0 − XΠ0 ) (Y 0 − XΠ0 ) 2 2 (2-32) (2-33) (2-34) 的最大化等价于广义方差 (Y 10 − XΠ10 )0 (Y 10 − XΠ10 ) (2-35) 的极小化,得到的 Π̂10 就是简化式模型的最大似然估计量。 完 全 信 息 最 大 似 然 估 计 完 全 信 息 最 大 似 然 法( F ullInf ormationM aximumLikelihood, F IM L)是 一 种 已 有 实 际 应 用 的 联 立 方 程 模 型 的 系统估计方法。Rothenberg 和 Leenders 于 1964 年提出一个线性化的 F IM L 估计量。F IM L 是 M L 的直接推广,是在已经得到样本观测值的情况下,使整个联立方程模型系统的似然函数 达到最大以得到所有结构参数的估计量。 2.10 贝叶斯估计 贝叶斯(Bayes)统计是由 T.R.Bayes 于 19 世纪创立的数理统计的一个重要分支, 20 世纪 50 年代,以 H.Robbins 为代表提出了在计量经济学模型估计中将经验贝叶斯方法与经典方法 相结合,引起了广泛的重视,得到了广泛的应用。贝叶斯估计对经典计量经济学模型估计方法 的扩展在于,它不仅利用样本信息,同时利用非样本信息。 贝 叶 斯 方 法 的 基 本 原 理 贝叶斯方法是与传统(也称经典的)计量经济学模型的估计方法 相对的一种统计学方法。它的基本思路是:认为要估计的模型参数是服从一定分布的随机变 量,根据经验给出待估参数的先验分布(也称为主观分布),关于这些先验分布的信息被称为 先验信息;然后根据这些先验信息,并与样本信息相结合,应用贝叶斯定理,求出待估参数的 后验分布;再应用损失函数,得出后验分布的一些特征值,并把它们作为待估参数的估计量。 贝叶斯方法与经典估计方法的主要不同之处是: • 关于参数的解释不同:经典估计方法认为待估参数具有确定值,它的估计量才是随机的, 如果估计量是无偏的,该估计量的期望等于那个确定的参数;而贝叶斯方法认为待估参数 是一个服从某种分布的随机变量。 • 所利用的信息不同:经典方法只利用样本信息;贝叶斯方法要求事先提供一个参数的先验 分布,即人们对有关参数的主观认识,被称为先验信息,是非样本信息,在参数估计过程 中,这些非样本信息与样本信息一起被利用。 • 对随机误差项的要求不同:经典方法,除了最大或然法,在参数估计过程中并不要求知道 随机误差项的具体分布形式,但是在假设检验与区间估计时是需要的;贝叶斯方法需要知 道随机误差项的具体分布形式。 - 17 - 2.11 渐近方法 • 选择参数估计量的准则不同:经典方法或者以最小二乘,或者以最大或然为准则,求解参 数估计量;贝叶斯方法则需要构造一个损失函数,并以损失函数最小化为准则求得参数估 计量。 贝叶斯定理 g(θ |Y ) = f (Y |θ )g(θ) f (Y ) (2-36) 2.11 渐近方法 来自[16]第十四章渐近方法。 渐近分布 定义 2.3 (渐近分布) 用 T1 < T2 < · · · < TN 表示连续递增样本容量,设在每个样本容量 Ti 下重复抽样,则每个 XTi 都有自己的样本均值和方差利用递增样本可以求得随机样本序列 XT = {XT1 , · · · , XTN },其中每个元素是相应样本容量下的一个随机变量。当 TN → ∞ 时,这 些分布收敛于某一分布,则称该分布为渐近分布或极限分布。 相应的,可建立渐近期望和渐近方差概念。 问题 2.1 lim E[XT − E(XT )]2 = 0,即分布退化成一点。 用 T 乘 V ar(XT ) 使 T V ar(X̂) → σ 2 。O、 o 记 号 随机变量: Op , op ;非随机变量: O, o。 设 {an } 和 {bn } 是两个实数序列: 定义 2.4 an = O(bn ) ,读作 an 是大 Obn ,若比值 |an /bn | 对大的 n 都有界;或,存在 一个数 K 和一个整数 n(K) 使得当 n 大于 n(K) 后总有 |an | > K |bn |。即,{an } 和比较的序 列 {bn } 有相同的阶。 定义 2.5 an = o(bn ) , 读 作 an 是 小 obn , 若 比 值 |an /bn | 收 敛 于 零 ; 或 ,∀ε > 0,∃n(ε),使得当 n > n(ε) 时,就有 |an | < ε |bn |。即,{an } 和比较的序列 {bn } 有更小的 阶。 想法是比较 {bn } 对 {an } 近似的阶或量。一些重要的 {bn } 是 bn = n−1 , bn = n−1/2 , bn = n, bn = n log n。 阶的比较是涉及序列的”大 N ”的性质而与序列的初始值无关。 (1) {an } 的值是无穷或是对有限个 n 没有定义,它是不受此影响的; (2) 若 kan k 表示向量 an 的长度,即 kan k = sX a2ni (2-37) i (2.4)和(2.5)都可用于向量序列 {an }; (3) 若 c 是非零常数,则 an = O(bn ) 与 an = O(cbn ) 是等价的; (4) an = o(1) 表示 an → 0,an = O(1) 表示对某个 K ,只要 n 充分大就有 |an | ≤ K ,即 |an | 本质上是界的; (5) an = O(an ) 总成立; - 18 - 第二章 估计方法引论 (6) 乘积规律: O(an )O(bn ) = O(an bn ) O(an )o(bn ) = o(an bn ) o(an )o(bn ) = o(an bn ) (2-38) (7) 求和规律:和数的阶是被加项中最大的的阶。(当被加的项依赖于 n 时就不一定对) 例 2.1 e 的近似 序列 en 是: 1 n ) (2-39) n 可先取对数 log(en ) = n log(1+n−1 ),求取对数后的极限再反求对数得到。令 f (t) = log(1+t), 泰勒一阶展开: f (t) en = (1 + = f (0) + f 0 (0)t + o(t) (2-40) = t + o(t) 所以 log(en ) = n log(1 + n−1 ) = n(n−1 + o(n−1 ) (2-41) = 1 + o(1) 因此 log(en ) → 1 问题 2.2 (2-42) {en } 收敛到 e 速度比较慢,为此修正 en 并考虑 f (t) 的高阶展开式。 定义序列 xn 为 xn = log(1 + n−1 ) (2-43) {(n + c)xn } (2-44) 考虑序列 其中 c 为待定常数。将序列 xn 二阶展开: 1 xn = f (n−1 ) = n−1 − n−2 + o(n−2 ) 2 (2-45) 所以 (n + c)xn 1 = (n + c)(n−1 − n−2 + o(n−2 ) 2 (2-46) 1 1 1 −2 c − cn + no(n−2 ) + co(n−2 ) =1+ − n 2n 2 1 = 1 + (c − )n−1 + o(n−1 ) 2 1 选择 c = 2 ,(n + c)xn 收敛于 1 的阶从 o(1) 改进到 o(n−1 )。这样定义一个新序列 e∗n : 1 e∗n = (1 + n−1 )n+ 2 它的收敛速度比 en 要快。 - 19 - (2-47) 2.11 渐近方法 同理,可按三阶泰勒展开,考虑 {(n + c + dn−1 } 序列。f (t) = log(1 + t) 的三阶展开是 1 1 f (t) = t − t2 + t3 + o(t3 ) (2-48) 2 3 则 (n + c + dn−1 )xn 2 1 = (n + c + dn−1 )(n−1 − n−2 + n−3 + o(n−3 ) 2 3 (2-49) 1 可以证明 c = 21 ,d = − 12 。 随 机 序 列 的 收 敛 性 依 分 布 收 敛 渐近方法的众多的重要统计应用之一是计算显著性水平概 率的近似值和给出置信区间,依分布收敛是评判这些近似的技术性工具。 若 {X n } 是一元随机变量序列,则它的分布函数是 Fn (x) = P {Xn ≤ x} (2-50) 若 Xn 是离散型随机变量,则 Fn (x) 是右连续的阶梯函数,只在 Xn 取值的点上有跳跃。 定义 2.6 (依分布收敛) 设 Xn 的分布函数是 Fn ,X 的分布函数是 F ,则当 lim Fn (x) = F (x) n→∞ (2-51) 对 F 的所有连续点 x 都成立,则称 Xn 依分布收敛于 X 。 依 概 率 收 敛 一个数字的常数 C 总是看成一个退化的随机变量 C ,它的分布是全部概率集 中于一个点 c 上。它的分布函数是 ½ 0 xq (7-25) ρk 从 ρ1 开始指数衰减。 rho1 的大小取决于 φ1 和 θ1 ,符号取决于 (φ1 − θ1 )。 自相关图平稳性检验 定义 7.24 (相关图correlogram) 由 ARM A 模型性质,一个时间序列若是平稳的,则其 ACF 就是拖尾或截尾的。自相关图是由点(k, ρk ) 作成的点图。基于样本 Y1 , Y2 , · · · , YT 取 γ̂k 为 γk 的一个矩估计: P (Yt − Ȳ )(Yt+k − Ȳ ) (k = 0, 1, · · · ) γ̂k = T 从而得到 ρk 的一个估计 ρ̂k = γ̂k /γ̂0 。 当用样本矩估计随机过程的自相关函数,则称其为相关图或估计的自相关函数,记为 Ck γk = k = 0, 1, · · · , K k < T (7-26) C0 - 134 - 第七章 时间序列计量经济学模型理论与方法 其中 T −k 1 X Ck = (xt − x̄)(xt−k − ¯(x)) T t−1 相关图是对自相关函数的估计。由于 M A 和 ARM A 过程中的 M A 分量的自相关函数具有截 尾特征,所以通过相关图可以估计 M A 过程的阶数 q 。实际应用中相关图一般取 k = 15 就足 够了。 为检验时间序列的平稳性,首先考虑序列的纯随机性,即白噪声检验,即检验所有滞后超 过 1 的 ACF 同时为零: H 0 : ρ1 = ρ2 = · · · = ρm = 0 利用 Box − P ierceQ 统计量: 统计量 7.1 (Box − P ierceQ 统计量) Q(m) = T m X ρ̂2k k=1 它具有大样本分布 χ2m 。 利用 χ2 的可分割性,可利用 Q 统计量来验证自相关函数的”拖尾性“,即自某一滞后开始的 零假设是否能被拒绝。若自相关函数不具有拖尾性,尤其介呈随滞后值 k 增加的趋势,则时间 序列是非平稳的。 例 7.4 (自相关图检验) 用 Q 统计量对我国 1987 − 2004 年国民生产总值进行平稳性检验 例 7.5 (差分平稳和 d 求和阶) 对 我 国 国 民 生 产 总 值 进 行 差 分 平 稳 dif f erencestationary ,确定其 d 求和阶 integratedof orderd。 源 代 码 7.5 差分平稳和 d 求和阶 proc arima data=gdp; 2 identify var=gdp(1); 3 run; 1 源 代 码 7.4 1 2 3 4 5 6 7 自相关图检验 data gdp; input gdp; datalines ; 3624.1 4038.2 4517.8 4862.4 5294.7 5934.5 7171.0 8964.4 10202.2 11962.5 14928.3 16909.2 18547.9 21617.8 26638.1 34634.4 46759.4 58478.1 67884.6 74462.6 78345.2 82067.5 89468.1 97314.8 105172.3 117390.2 136875.9 ; 8 proc arima data=gdp; 10 identify var=gdp; 11 run; 9 - 135 - 7.8 随机时间序列分析模型(AR、MA、ARMA)的估计 ARMA(p,q)的 自 相 关 函 数 ARM A(p, q)的自相关函数,可以看作 M A(q) 的自相关函数 和 AR(p) 的自相关函数的混合物。当 p = 0时,它具有截尾性质;当 q = 0 时,它具有拖尾性 质;当 p!q 都不为 0 时,它具有拖尾性质。经过推导得到,ARM A(p, q) 的自协方差函数为: rk = E(yt+k yt ) = ϕ1 rk−1 + ϕ2 rk−2 + · · · + ϕp rk−p + ryµ (k) − θ1 ryµ (k − 1) − · · · θq ryµ (k − q) 其中 ½ ryµ (k) = E(yt µt+k ) = 0 k>0 k<0 σµ2 ψ−k ARM A(p, q) 的自相关函数为: rk ρk = = ϕ1 ρk−1 + ϕ2 ρk−2 + · · · + ϕp ρk−p r0 偏 自 相关 函数 γk 的方差近似地为 T −1 。当 T 充分大时: √ γk − 0 = γ T ∼ N (0, 1) k 1 T−2 (7-27) 偏自相关函数在滞后期 p以后有截尾特性,因此可用此特征识别AR(p)过程的阶数。 偏相关图 对于被估的位于时间间隔 K 的偏自相关函数的标准误差的近似值的计算基于如下零假设: 阶数为 K − 1 的纯自回归高斯过程生成所考虑的序列,其标准误差为 √1n ,置信区间为 95。 时期差为 k 的协方差为 γk = E[yt−k (φ1 yt−1 + φ2 yt−2 + · · · + φp yt−p + ²t )] 令 k = 0, 1, · · · , p,我们得到 p + 1 个差分方程,从它们可以解出 γ0 , γ1 , · · · , γp : γ0 = φ1 γ1 + φ2 γ2 + · · · + φp γp + σ²2 γ1 = φ1 γ0 + φ2 γ1 + · · · + φp γp−1 ············ γp = φ1 γp−1 + φ2 γp−2 + · · · + φp γ0 在上式每个方程两边同时除以 γ0 ,我们就可以解出 ρ1 , ρ2 , · · · , ρp 的 p 个方程。这个方程称为 定义 7.25 (Yule-Walker 方程组) 1 = φ1 ρ1 + φ2 ρ2 + · · · + φp ρp + σ²2 /γ0 ρ1 = φ1 + φ2 ρ1 + · · · + φp ρp−1 ··· ········· ρp = φ1 ρp−1 + φ2 ρp−2 + · · · + φp (7-28) 当 ρ1 , ρ2 , · · · , ρp 已知时,由这些方程组就可以解出 φ1 , φ2 , · · · , φp 。 Y ule − W alker 方程组求解需要知道自回归过程的阶数。因此,我们可以(利用样本自相 关函数)对连续的 p 值求解 Y ule − W alker 公式,得到偏自相关函数。偏自相关函数近似地服 从均值为零,方差为 1/4 的正态分布。因此,我们可以在显著性水平 5% 下通过考察偏自相关 √ 函数序列的绝对值是否大于 2/ T 来检验某个值是否显著在不为 0。 7.8 随机时间序列分析模型(AR、MA、ARMA)的估计 自 回 归模 型 : AR 模型 yt = φ1 yt−1 + φ2 yt−2 + · · · + φp yt−p + δ + εt - 136 - (7-29) 第七章 时间序列计量经济学模型理论与方法 如果自回归过程是平稳的,则它的均值关于时间一定是常数: δ µ= 1 − φ1 − φ2 − · · · − φp 时期差为 k 的协方差为: ρk = φk1 γ0 = 齐 次 非平 稳 过程 : ARIMA φk1 σε2 1 − φ21 模 型 如果 wt = ∆d yt 平稳序列,我们就称 yt 是 d 阶齐次非平稳序列。 对序列 yt 差分得到平稳序列 wt 后,我们可以用 ARM A 过程对 wt 建立模型。如果 wt = ∆d yt 且 wt 是一个 ARM A(p, q) 过程,则我们称 yt 是 (p, d, q) 阶综合自回归――移动平均 过程(anintegratedautoregressive − −movingaverageprocessof order)或 ARM A(p, d, q)。 我们可以利用向后位移算子将其写为: φ(B)∆d yt = δ + θ(B)²t 其中: 自回归算子 φ(B) = 1 − φ1 B − φ2 B 2 − · · · − φp B p 移到平均算子 θ(B) = 1 − θ1 B − θ2 B 2 − · · · − θq B q 且有 wt = ∆d yt 的均值为: µw = δ 1 − φ1 − φ2 − · · · − φp 如果 θ 不为0,综合序列 yt 将有一个确定性的趋势。 注意到如果有序列 wt ,我们可以通过对其求和 d 次而回到 yt :yt = 的 Yule Walker方 程估 计 −1 ϕ̂1 ρ̂0 ρ̂1 · · · ρ̂p−1 ρ̂1 ϕ̂2 ρ̂1 ρ̂0 · · · ρ̂p−2 ρ̂2 .. = .. .. . . .. .. . . . . . . ϕ̂p ρ̂p−1 ρ̂p−2 · · · ρ̂0 ρ̂p p p P P ϕ̂i ϕ̂i r̂j−i ϕ̂j r̂j = r̂0 − σ̂µ2 = r̂0 − i,j=1 j=1 MA(q)模 型 的 矩 估 计 σ̂µ2 (1 + θ̂12 + θ̂22 + · · · + θ̂q2 ) k = 0 r̂k = σ̂µ2 (−θ̂k + θ̂1 θ̂k+1 + · · · + θ̂q−k θ̂q ) 1 ≤ k ≤ q 0 k>q ARMA(p,q)模 型 的 矩 估 计 ρ̂q ϕ̂1 ϕ̂2 ρ̂q+1 .. = .. . . ϕ̂p −1 ρ̂q+1 ρ̂q−1 · · · ρ̂q−p+1 ρ̂q · · · ρ̂q−p ρ̂q+2 .. . ρ̂q+p−1 ρ̂q+p−2 · · · - 137 - ρ̂q ρ̂q+p Pd wt 。AR(p)模 型 7.9 传递函数模型 7.9 传递函数模型 定义 7.26 (传递函数模型) 如果时间序列模型描述某一时间序列的性态是由另一些时间 序列来解释的,则称这一模型为多变量时间序列模型 multipletimeseriesmodel。描述这些变量 之间的动态关系的模型,称为传递函数模型 transf erf unctionmodel。传递函数模型一词与多 变量时间序列模型一词是可以交换使用的。 输出 Y 与输入 X 间的动态关系可以用一个线性模型或线性系统表示: Yt = α0 Xt + α1 Xt−1 + α2 Xt−2 + · · · = α(L)Xt 其中 α(L) = α0 + α1 L + α2 L2 + · · · 称为滤波器 linearf ilter,权重 α0 , α1 , · · · 称为脉冲响应函 数 impulseresponsef unction。称 α(L) 是稳定的 stable,如果对于 |L| ≤ 1,级数 α0 + α1 L + α2 L2 + · · · 收敛。 一般地,传递函数模型具有如下的形式: θ(L) β(L) Xt + εt Yt = δ(L) α(L) 其中 varepsilont 是白噪声序列,β(·), δ(·), θ(·), α(·) 为多项式,并要求 Yt 与 Xt 都是平稳的。 7.10 时间序列ARIMA建模:BOX-Jenkiens 建模步骤 Φ(L)∆d yt = θ0 + Θ(L)ut (7-30) • φ(L) 和Θ(L) 是 L 的函数,其根在单位圆外 • θ0 是位移项 • yt 经过 d 次差分后可表达为一个平稳可逆的 !ARM A 过程 建模过程见(7-3): 模 型 的 识 别 model identification 通过对相关图的分析,初步确定 ARIM A 模型的形 式,即 p, d, q 的值。第一步: (1) 模型的识别主要依赖于自相关和偏相关图 (2) 对经济数据取对数以消除异方差 (3) 判断随机过程是否平稳:如果一个随机过程是平稳的,其特征方程的根都应在单位圆之 外:如果 Φ(L) = 0 的根接近单位圆,自相关函数将衰减的很慢。 (4) 在分析相关图时,如果发现其衰减很慢,即可认为该时间序列是非平稳的。这时应对该时 间序列进行差分,同时分析差分序列的相关图以判断差分序列的平稳性,直至得到一个平 稳的序列。 (5) 参数 d 通常只取 0,1或 2。 (6) 实际中也要防止过度差分。一般来说平稳序列差分得到的仍然是平稳序列,但当差分次数 过多时存在两个缺点,(1)序列的样本容量减小;(2)方差变大;所以建模过程中要防 止差分过度。对于一个序列,差分后若数据的极差变大,说明差分过度。 第二步: - 138 - 第七章 时间序列计量经济学模型理论与方法 ϔ.䆚߿ ⫼Ⳍ݇݇Ⳍأ䆚߿ൟ ᔶᓣ˄⹂ᅮখ᭄ d, p, q˅ Ѡ.Ԅ䅵 ᇍ߱ℹ䗝পⱘൟ䖯㸠খ᭄Ԅ䅵 ϝ.䆞ᮁϢẔ偠 ࣙᣀখ᭄ⱘᰒ㨫ᗻẔ偠 ⅟Ꮒⱘ䱣ᴎᗻẔ偠 ϡৃপ ൟৃপ৫ ৃপ ℶ 图 7-3 ARIMA 建模过程图 (1) 在平稳时间序列基础上识别模型的阶数。 (2) 时间序列的相关图与偏相关图可为识别模型参数 p, q 提供信息。相关图和偏相关图(估计 的自相关系数和偏自相关系数)通常比真实的自相关系数和偏自相关系数的方差要大,并 表现为更高的自相关。 (3) 估计的模型形式不是唯一的,所以在模型识别阶段应多选择几种模型形式,以供进一步选 择。 模 型 的 估 计model estimation 在实际应用中,最小二乘估计很难被应用,因为存在严 重的共线性。一般采用极大似然法对参数进行估计。对一组相互独立的随机变量 xt ,t = 1, 2, · · · , T ,获取一个样本 x1 , x2 , · · · xT ,则有似然函数 L(γ|x1 , x2 , · · · , xT ) = f (x1 |γ)f (x2 |γ) · · · f (xT |γ) T Q = f (xt |γ) t=1 其中 γ = γ1 , · · · , γk 是一组未知参数。取对数构成对数似然函数,然后采用拉格朗日方法对对 数似然函数求极大值,得出 γ 。极大似然估计量具有一致性的渐近有效性。 思考 7.4 用极大似然法推导 yt = β0 + β1 xt1 + β2 xt2 + · · · + βk−1 xt(k−1) + ut , ut ∼ N (0, σ 2 ) - 139 - 7.10 时间序列ARIMA建模:BOX-Jenkiens LogL = T X t=1 T T T 1 X logf (yt ) = − log2π − logσ 2 − 2 [yt − E(yt )]2 2 2 2σ (7-31) t−1 对 时 间 序 列 模 型 参 数 进 行 估 计 对于非平稳过程 yt ,经过 d 次差分后可以化为平稳、可逆 的综合自回归移动平均过程 xt : Φ(L)∆d yt = Θ(L)ut (7-32) 它可改写为 ut = Φ(L) xt Θ(L) (7-33) 对于 yt 假定可以观测到 T + d 个观测值 y−d+1 , y−d+2 , · · · , y0 , y1 , · · · , yT 。经过 d 次差分后,xt 的容量为 T 。参数估计的标准的是使观测值与拟合值平方和最小。 根据(7-31)可得条件似然函数 P LogL = −T logσu − 2 t ût 2σu2 (7-34) 称 之 为 条 件 似 然 函 数 是 因 为 û2t 依 赖 于 过 去 的 不 可 知 观 测 值 x0 , x1 , · · · , x−p+1 和 u0 , u−1 , · · · , u−1+1 。此问题的一般处理方法是取它们的无条件期望值。 u0 , u−1 , · · · , u−1+1 的无条件期望值为零。 (1) 若模型(7-32)不包含漂移项,则 x0 , x1 , · · · , x−p+1 无条件期望值为零; (2) 若模型(7-32)不包含移动平均项,则(7-33)是一个线性函数,可以用 OLS 法估计参数; (3) 若模型(7-32)包含移动平均项,则(7-33)是一个非线性函数,要采用非线性方法估计参 数。 假定模型是纯自回归形式: Φ(L)xt = ut (7-35) xt = φ1 xt−1 + φ2 xt−2 + · · · + φp xt−p + ut (7-36) 或 对于参数而言,这是一个线性回归模型,用以直接用 OLS 法估计,并且和 M L 法结果近似。 估 计 量 的 评 价 问 题 用于线性回归模型的 F, t 统计量不能直接用于评价非线性模型。原因 是:虽然 ut 是正态分布且均值为零,但残差: ût = xt − x̂t = xt − f (xt−1 , xt−2 , · · · , xt−p , γ1.k , · · · , γp+q.k ) P 并不服从正态分布,则 ût 并不服从 χ2 分布,参数估计量不服从正态分布。 模 型 的 诊 断 与 检 验 model diagnostic checking 以样本为基础检验模型。如果模型某些 参数值不能通过显著性检验,或残差序列不能近似白噪声,则要返回第一步。 检验拟合的模型是否合理: (1) 检验模型的参数估计值是否有显著性,用 t 检验完成; (2) 检验模型的残差序列是否为白噪声,用 Box − P ierce (1970) 提出的 Q统计量完成。 检验方法 7.3 (Q 检验) 白噪声。 统计量: Q 统计量Q = T 零假设: H0 : ρ1 = ρ2 = · · · = ρk = 0 即假设模型的误差项是一个 PK 2 2 k=1 γk 它近似服从 χ (k − p − q) 分布。γk 表示自相关系数值。 判别规则: 用残差序列计算 Q 统计量的值。显然若残差序列不是白噪声,残差序列中必含 有其他成份,自相关系数不等于零。则 Q值将很大,反之 Q 值将很小。 - 140 - 第七章 时间序列计量经济学模型理论与方法 修正的统计量:上式定义的统计量与 χ2k−p−q 分布存在差异,相应值可能偏小,Ljung 和 Box 提出修正的 Q 统计量 K X γk Q = T (T + 2) T −k k=1 非 线 性模 型 的估 计 如果模型包含移动平均项,则模型对于参数而言是非线性的。一般采用 P 如下三种方法:直 直接 搜 索 法 通过改变参数的取值,反复计算残差平方和 û2t 的值。然后从中 选择最小的那个值所对应的参数值作为对参数的估计值。这种方法只有在参数个数较少时才是 可行的。当参数个数较多时,计算量将非常大。 直 接 优化 法 求误差平方和函数对每一个参数的偏导数并令其为零,从而求得正规方程 ¶ µ P 2 ∂ ût t = 0, i = 1, 2, · · · , p + q ∂γi 其中 γ = (γ1 , γ2 , · · · , γp+q ) = (φ1 , · · · , φp , θ1 , · · · , θq ) 因为 p + q 个方程中都含有 p + q 个参数,所以必须联立求解。由于计算上的困难,这种方法很 少直接采用。 线 性 迭代 法 对任何非线性函数通常都可以按泰勒级数展开。 首先为参数选一组初始值,将 xt = f (xt−1 , xt−2 , · · · , xt−p 在选定的初始点 (γ1.0 , · · · , γp+q.0 ) 按 T aylor 展开。 取展开式前两项,用 OLS 法估计得出第二个点。依此类推。 中止标准: |γi,j+1 − γi,j | <δ γi,j 7.11 ARCH 模型 若一个平稳随机变量 xt 可以表示为 AR(p) 形式,其随机误差项的方差可用误差项平方的 q 阶分布滞后模型描述 均值方程 xt = β0 + β1 xt−1 + βxt−2 + · · · + βp xt−p + ut (7-37) ARCH 方程 σt2 = E(u2t ) = α0 + α1 u2t−1 + α2 u2t−2 + · · · + αq u2t−q 则称 ut 服从 q 阶的 ARCH 过程。它的无条件方差是 α P0q σ2 = 1 − i=1 αi (7-38) ARCH(q) 模型是关于 σt2 的分布滞后模型。为避免 u2t 的滞后项过多,可采用加入 σt2 的滞 后项的方法: 2 σt2 = α0 + α1 u2t−1 + λ1 σt−1 (7-39) 此模型称为广义自回归条件异方差模型,用 GARCH(1, 1) 表示。其中 ut−1 称为 ARCH 荐,σt−1 称为 GARCH 项。它的无条件方差是 α0 Pq P (7-40) σ2 = 1 − i=1 αi − pi=1 λi - 141 - 7.12 多项式分布滞后模型Polynomial distributed lags PDLs 对于 ARCH(p) 模型和 GARCH(p, q) 模型,在实际应用中,条件 q X 0≤ αi ≤ 1 i=1 q X 0≤( αi + i=1 p X (7-41) λi ) ≤ 1 i=1 有时不能得到满足。 为了保证方差为正,又提出了如下两种模型形式。一种是绝对值模型 GARCH/ARCH 模 型: q p X X 2 2 σt = α0 + αi |ut−i | + λj σt−j (7-42) i=1 j=1 另一是指数 GARCH(Nelson 1991): 7.12 多项式分布滞后模型Polynomial distributed lags PDLs 对于时间序列数据,由于经济系统中的经济政策的传导、经济行为的相互影响和渗透都是 需要一定时间的。它们的数值是由自身的滞后量或其他变量的滞后量所决定的,因此需要考虑 变量之间的滞后关系。表现在计量经济模型中,即应当包括某些滞后变量于解释变量中。比如 分析货币政策效应时,经常分析货币供给对产出的影响,要在模型中加入货币供给的多期滞 后,以反映出货币政策的时滞性。 yt = α + β0 xt + β1 xt−1 + · · · + βk xt−k + ut t = 1, 2 · · · , T 系数 β 反映了 x 对 y 的乘数作用。 7.13 无限分布滞后模型 Infinite Distributed Lag Model yt = α + δ0 zt + δ1 zt−1 + δ2 zt−2 + · · · + ut • IDL模型不要求在某个特定时刻截断滞后 • 很远的过去的z 对 y 的解释能力不如较近的过去的 z • 短期倾向是 δ0 ,这意味着,z 的一个暂时变化对 y 的期望没有长期影响 E(yh ) = α + δh • 长期倾向是所有系数之后,这意味着 z 的一个单位的永久增长,y 的期望值的长期变化 E(yh ) = α + δ0 + · · · + δh 这隐含着严 严格 外 生 性 假 定 :z 的任何变化对 y 的期望值没有影响。它不允许 yt 对将来的 z 的反 作用。 E(ut | · · · , zt−2 , zt−1 , zt , zt+1 , · · · ) = 0 更弱一点的假定是: E(ut |zt , zt−1 , · · · ) = 0 这个假定使得 z 服从一种政策规则。 - 142 - 第七章 时间序列计量经济学模型理论与方法 7.14 几何(或考依克)分布滞后 IDL 不 能 无 约 束 地 估 计 出 一 切 系 数 。 一 种 简 单 形 式 是geometricorKoyckdistributedlag, GDL。在这个模型中,每个 δi 取决于 δj = γρj , |ρ| < 1, j = 0, 1, 2, · · · • GDL 的即期倾向 IP 是 δ0 = γ • 长期倾向 LRP = γ(1 + ρ + ρ2 + · · · ) = γ/(1 − ρ) 7.15 有理分布滞后模型 rationaldistributedlagRDLmodel yt = α0 + γ0 zt + ρyt−1 + γ1 zt−1 + vt 它与无限分布滞后模型是等价的。 • 即期倾向是 γ0 • zt−h 的系数是 ρh−1 (ργ0 + γ1 ) • LRP 是 (γ0 + γ1 )/(1 − ρ) 7.16 趋势和季节性 忽略两个序列按相同或相反趋势发展这一事实会导致错误的结论,认为一个变量的变化由 另一个变量的变化引起。什么样的模型能恰当地描述有趋势的行为? yt = α0 + α1 t + et et ∼ i.i.d. 参数 α1 与时间 t 相乘的形式形成了一个线性时间趋势 lineartimetrend。α1 度量了由于时间的 流逝,yt 从一个时期到下一个时期的变化。 • E(yt ) = α0 + α1 t • V ar(yt ) = V ar(et ) = σe2 • yt 是独立但非同一分布的序列 定义 7.27 (指数趋势) 经济序列通用指数趋势 exponentialtrend 来迫近。当一个序列从 一个时期到另一个时期的平均增长率为恒定时,它就服从指数趋势。 在实践中,时间序列中的指数趋势可以通过建立有线性趋势的自然对数模型得到: log(yt ) = β0 + β1 t + et , t = 1, 2, · · · beta1 近似等于 yt 各项增长率的平均值: yt − yt−1 β1 = = ∆ log(yt ) yt−1 趋势变量并不一定违背经典线性模型的假定。 仅仅因为每个变量都随时间增长,而在两个或更多的趋势变量之间找到某种关系的现象是 谬 误 回归 spuriousregression 的一个例子。 在回归模型中引进时间趋势,相当于在回归分析中在使用原始数据之前将它们的趋势去 掉。 时间序列回归中的 R2 通常很大,与典型的横截面数据的 R2 相比尤其大。这是因为: • 时间序列数据通常是总量数据,这相比个人、家庭或企业的数据容易解释一些 • 因变量有趋势时,时间序列回归中的普通的或较正的 R2 可能会人为变大 - 143 - 7.17 总结 7.17 总结 (1) 基于时间序列数据的回归分析都默许地假定时间序列是平稳的。经典的 t, F 检验等都基 于此一假定。在经济实践中,大多数的时间序列都是非平稳的。 (2) 一个平稳的时间序列,从直观上可以看作一条围绕其平均值上下波动的曲线;从理 论 上 , 有 二 种 意 义 的 平 稳 性 : 一 是 严 平 稳(stationaryinthestrictsense), 另 一 是 宽 平 稳(stationaryinthewidesense)。概率分布随同时间的平移而不变的序列是严平稳序列; 而均值、方差与协方差函数不随同时间变化的序列是宽平稳序列。 (3) 平稳性的检验有二种方法。较为粗略的方法是周期图性:若周期图衰减得很快,则可认为 该序列是平稳的;否则是非平稳的。对纯随机序列,即白噪声序列,在所有大于或等于 1 的滞后处,自相关函数全为零。较为精细的方法是单位根法:若在统计意义上认为单位根 存在,则序列不平稳。单位根检验主要有 DF, ADF 检验方法。 (4) 对非平稳的时间序列 Yt ,有二种途径可将其转化为平稳序列。一是差分平稳(DS),即经 过某一阶差分(如 d 阶 δ d Yt )将达到平稳,此时,我们就称原序列具有 d 求和阶,记 为 I(d);另一是趋势平稳,即 Yt − f (t) 为一平稳序列,其中 f (t) 是一确定性的趋势曲 线。DF, ADF 检验可用来检验一个时间序列是 DS 还是 T S 。 (5) 对于非平稳时间序列,一个时间序列变量关于另一个或多个时间序列变量的回归,很有可 能会导致假性回归,即拟合效果很好(如有较高的可决系数 R2 ),但作深入研究会发现 参数估计与常理不符。假性回归检验,经验性地有一经纶准则:若 R2 > DW ,则所估计 出的样本回归可能是假性回归;严格地,需从协整性的角度来测定。 (6) 一组时间序列 Xit , · · · , Xpt (p ≥ 2) 称为具有 (d, b) 阶协整性(0 < b ≤ d),是指:该序 列均为 I(d) 序列,且它们的线性组合为一个 I(d, b) 序列。通常所指的协整性是指非平稳 的 DS 序列的线性组合达到平稳。协整性的探测方法有 EG 检验、AEG 检验和 CRDW 检验。协整性的存在意味着变量间存在着一种长期的或均衡的关系。 (7) 为了协调经济变量短期性态与长期性态之间的矛盾,可以应用 ECM 。 (8) 时间序列经济计量学建模在某些场合是暂时的,需要作进一步的改进。在这一领域最为关 心的问题是:时间序列何时、为何平稳或不平稳? (9) 作为一种预测方法,BJ 方法包括以下四步骤:模型识别;模型估计;模型诊断校验和模 型预测。在许多情形,此方法所进行的预测会比传统的经济计量建模所得的预测更可靠, 尤其是短期预测。 (10) 经济时间序列的季节性,可用虚拟变量和 ARIM A 模型来调整。 (11) Granger 指 出 : “ 协 整 性 检 验 testf orcointegration” 可 以 看 作 避 免 假 性 回 归 spuriousregression 的预检验“。 (12) 在小样本情形,似然法倾向于低估误差方差;二乘法的 M SE 高估 σ̂ 2 。 - 144 - 第八章 横截面时间序列模型 第八章 横截面时间序列模型 8.1 基本原理 定义 8.1 (独立混合横截面) independently pooled cross section它是在不同时点(经常但 不一定是不同年份)从一个大总体里进行随机抽样的结果。如,每隔一年对某城市出售的住房 抽取一个关于售价、面积、间数的随机样本。从统计学观点看,这些数据集有一个重要特点: 它们都是由独立抽取的观测值构成的,这排除了在不同观测值中误差项有相关关系。如果每个 时期都抽取一个随机样本,那么将所得到的随机样本合并起来就给出一个独立混合横截面。 一个独立混合横截面和单一个随机样本的差异在于,在不同时点上对总体进行抽样很可能导致 观测点不是同分布的。如,随着时间的流逝,工资和学历的分布已经改变。这可以通过在多元 回归模型中容许截距或(和)斜率的改变来处理。 使用的理由是要加大样本容量,因为它是在不同时点从同一总体中抽取的多个随机样本混 合而成,从而可以得到更好的估计量和更具功效的检验统计量。但是,这 这仅 当 因 变 量 和 某 些 自 变 量 保 持 着 不 随 时 间 而 变 的 关 系 时 , 混 合 才 起 作 用 。使用混合横截面的一个问题是总 总体 在 不 同 时 期有 不 同分 布 ,对此,我们允许截距或斜率在不同年份或时点有不同的值。 此外,误差方差还可能随时间而改变。异方差―稳健标准误及其检验统计量可以用于此。 通过平方 OLS 残差对所有自变量回归,就能作出 Breush − P agan 检验;或作残差平方对所 有原来模型中包含的解释变量及其平方和交叉乘积项的回归进行 W hite 检验。W hite 检验的原 假设是不存在异方差,即检验辅助方程中除截距项外的所有自变量的系数为零。如果辅助回归 方程的拟合优度 R2 越大,说明残差平方受到解释变量影响越显著,也就越倾向于认为存在异 方差;或者计算 N × R2 ∼ χ2k 来判断;或者用辅助回归方程的 F 统计量来判断模型显著性。 在存在异方差时,普通最小二乘估计量仍然是线性和无偏的,但不有效的,即不再具有方 差最小性,所以通常的假设检验不可靠。加权最小二乘程序能解决误差可能随时间而变的问 题。W LS 估计或获得有效估计,它是将权重序列分别与每个变量的观测值相乘,然后对变化 后的新模型利用 OLS 估计。 如果在方程中考虑所有自变量与某个年份虚拟变量乘积项的交互作用,等价于估计两个不 同的方程,一个对基年,一个对年份虚拟变量所代表的年。 邹至庄检验能用来决定两组数据之间的多元回归函数有无差别,我们同样可把这种检验用 于两个不同时期。 定义 8.2 (邹至庄统计量) SSR − (SSR1 + SSR2 ) n − 2(k + 1) F = × SSR1 + SSR2 k+1 它有一个重要的局限,即虚拟假设要求各组之间不存在任何差异。 定义 8.3 (综列数据) 兼有横截面和时间序列的维度,但在一些方面不同于独立混合横截 面,收集综列数据时要求对相同的观测对象在不同时点进行跟踪而获得数据。 利用综列数据的一个方法是把影响因变量的观测不到的因素分为两类:一类是恒常不变的; 一类则随同时间而变。 yit = β0 + δ0 dt + β1 xit + αi + uit 在时间恒定的因素称为非 非 观 测 效 应unobserved effect,固 固 定 效 应fixed effect,非 非观 测 差 异 性 unobserved heterogeneity。误差常称为特 特 异 性 误 差 idiosyncratic erroe或时 时 变time-varying。 上式还可写成: yit = β0 + δ0 dt + β1 xit + vit vit = αi + uit - 145 - 8.1 基本原理 式中,vi t 称为复 复合 误 差composite error。 定义 8.4 (差异性偏误) 在综列数据建模中,即使假定特异误差与解释变量不相关,如果 非观测效应与解释变量相关,混合 OLS 估计就是有偏误且不一致的。由此所造成的偏误称 做heterogeneity bias。然而,它的确是由于遗漏了一个时间上恒常的变量而引起的。 在大多数应用中,收集综列数据的主要理由是为了考虑非观测效应与解释变量相关。将数 据差分之后,非观测效应不再出现于模型中, 定义 8.5 (平衡综列数据) 如果对 N 个横截面单元的每一个都有同样的 T 期数据 AR1 模 型 的 F GLS 估 计 根 据 估 计 ρ 的 方 法 不 同 和 处 理 第 一 次 观 测 的 办 法 不 同 而 不 同。Cochrane − Orcuttestimation 省略了第一次观测,P rais − W instenestimation 则使用了 第一次观测:同乘以 (1 − ρ)1/2 。 取 一 阶 差 分 是 消 除 固 定 效 应 αi 一 种 方 法 , 另 一 种 方 法 是 固 定 效 应 变 换 f ixedef f ectstransf ormation,凡是在时间上恒定的解释变量都必定随机之而消失。以一 元模型为例: yit = β1 xit + αi + uit 对每个 i 求取时间上的平均: ȳi = β1 x̄i + αi + ūi 获取除 除去时 间 均值 后 的数 据 time − demeaneddata: 、 yit − ȳi = β1 (xit − x̄i ) + uit − ūi (8-1) (8-2) 或 ÿit = β1 ẍit + üit (8-3) 固定效应变换又称组 组 内 变 换 withintransf ormaiton。基于除时间均值变量的混合 OLS 估计量 被称为固 固 定 效 应 估 计 量 f ixedef f ectsestimator 或组 组 内 估 计 量 withinestimator。(8-3)的 OLS 使用了变量在每一横截面观测之内的时 时间 变 异timevariation。 对横截面方程(8-1)使用 OLS 估计量时,就给出了组 组间 估 计 量 betweenestimator:同时用 y 和 x 的时间平均代替 y 和 x,然后做一个横截面回归。它忽视了变量怎样在时间上变化所提供 的信息。 虽然不能把时间上恒常的那些变量本身包括到固定效应模型中来,却能把它们同随时间而 变的变量,特别是年虚拟变量交互起来分析。 定义 8.6 (虚拟变量回归) dummyvariableregression:对每个 i 估计一个截距,即连同诸 解释变量在一起,给每一个横截面观测单元安排一个虚拟变量(也许还给每个时期安排有虚拟 变量)。 • 它所给出的 βj 的估计值,与除均值数据回归得到的相同,标准误与主要统计量雷同 • 拟合优度较高,因为每一横截面都有一个虚拟变量,这能解释数据中的变异的大部分 非观测效应模型: yit = β0 + β1 xit + αi + uit 不管使用 F E 还是 F D,目的都是要把 αi 消去。这是因为,αi 被认为是与解释变量中之一或 全部相关。但 但若 是 不 相 关 , 则 变 换 会 导 致 非 有 效 的 估 计 量 。如果假定非观测效应 αi 与每一个 解释变量都不相关: Cov(xi tj, αi ) = 0 - 146 - 第八章 横截面时间序列模型 则方程为随 随机 效 应模 型 randomef f ectsmodel。 如 果 我 们 相 信 αi 与 解 释 变 量 不 相 关 , 则 可 用 单 一 个 横 截 面 对 βj 做 一 致 性 估 计 : 根 本 不 需要什么综列数据。 定义复 复合 误 差 项 为 vi t = αi + ui t 在随 随机效 应 假定 下有 Cov(vit , vis ) = σa2 t 6= s σa2 + σu2 由于通常的混合 OLS 标准误忽视了这种相关,以致标准误是不正确的,从而通常的检验统计 量也不正确。 yit = αit + xit βit + uit , i = 1, · · · , N, t = 1, · · · , T (8-4) 对于截面成员方程,待估计参数的个数为 N T (k + 1) + N ,对于时间截面成员方程,待估计参 数的个数为 (N T (k + 1) + T )。所以自由度 N T 远远小于参数个数,这使得模型无法估计。为 了实现模型的估计,可分别建立两类模型:从成员角度考虑的建立含有N 个个体成员方程的模 型和从时间点上截面建立含有 T 个时间点截面方程的模型。 yt = α + X t b + u t (8-5) yi = α + xi b + ui (8-6) 这个两类估计方法类似,一般讨论含有 N 个个体成员方程的模型。 根据截距项向量 α 和系数向量 β 中各分量的不同限制要求,可以将(8-5)分为三类: • 无个体影响的不变系数模型,或联合回归模型 pooledregressionmodel(8-7) • 变截距模型,或个体均值修正模型 individual − meancorrectedregressionmode(8-8) • 变系数模型,或无约束模型 unrestrictedmodel(8-9) yit = α + xit β + uit , i = 1, · · · , N, t = 1, · · · , T (8-7) yit = αi + xit β + uit , i = 1, · · · , N, t = 1, · · · , T (8-8) yit = αi + xit βi + uit , i = 1, · · · , N, t = 1, · · · , T (8-9) 8.2 模型的设定检验 建立时间序列截面数据模型的第一步是检验被解释变量 yit 的参数 αi 和βi 是否对所有个体 样本和时间点都是常数。经常使用的检验是协方差分析检验。 首先计算(8-9)的残差平方和: Wxx,i = Wxy,i = Wyy,i = T P t=1 T P t=1 T P t=1 (xit − x̄i )0 (xit − x̄i ) (xit − x̄i )0 (yit − ȳi ) (yit − ȳi )0 (yit − ȳi ) - 147 - 8.3 数据类型非经典的计量经济学模型:面板数据模型 其中 x̄i = T1 ȳi = T1 T P t=1 T P t=1 xit yit 则(8-9)的残差平方和记为 S1 = N X RSSi = i=1 N X −1 0 (Wyy,i − Wxy,i Wxx,i Wxy,i ) (8-10) i=1 其次计算(8-8)的残差平方和:记 N N N P P P Wxx = Wxx,i Wxy = Wxy,i Wyy = Wyy,i i=1 i=1 i=1 则(8-8)的残差平方和记为 0 −1 S2 = Wyy − Wxy Wxx Wxy (8-11) 最后计算(8-5)的残差平方和:记 Txx = txy = tyy = N P T P i=1 t=1 N P T P i=1 t=1 N P T P i=1 t=1 (xit − x̄)0 (xit − x̄) (xit − x̄)0 (yit − ȳ) 2 (yit − ȳ) 其中 x̄ = N1T N P T P i=1 t=1 xit ȳ = N1T N P T P i=1 t=1 yit 则(8-5)的残差平方和记为 −1 S3 = tyy − t0xy Txx txy (8-12) 结论: (1) S1 /σu2 ∼ χ2 [N (T − k − 1)] (2) S3 /σu2 ∼ χ2 [N T − (k + 1)] (S3 − S1 )/σu2 ∼ χ2 [(N − 1)(k + 1)] (3) χ2 [N T − (k + 1)] 与 S1 /σu2 独立。 1 )/[(N −1)(k+1)] F2 = (S3S−S 1 /[N T −N (k+1)] 2 −S1 )/[(N −1)k] F1 = (S S1 /[N T −N (k+1)] 8.3 数据类型非经典的计量经济学模型:面板数据模型 定义 定义 8.7 (面板数据) 面板数据(P anelDate),又称平行数据,是指在时间序列上取多 个截面,在这些截面上取多个样本观测值构成的数据,以 Yit 表示。其中,下标 i 表示不同的 时间点,下标 t 表示不同的观测对象。 - 148 - 第八章 横截面时间序列模型 最早使用面板数据进行单位根检验的是 Bhargava 等(Bhargavaetal, 1982)。他们利用修正 的 DW 统计量提出了一种可以检验固定效应动态模型的残差是否为随机游走的方法。Abuaf 和 Jorion (1990)基于 SU R 回归(seeminglyunrelatedregression)模型,采用 GLS 估计方法 提出了面板单位根检验方法 SU R − DF 检验。 平行数据的使用可以: (1) 使研究人员区分出单用截面数据或时间序列数据都不能得到的经济作用;(规模经济与技 术进步) (2) 平行数据集通常含有许多数据点,会带来较大的自由度; (3) 截面变量和时间变量的结合信息能够显著地减少缺省变量所带来的问题。 将截面数据和时间序列数据相混合的过程称为融合。 Yit = α + βXit + εit i = 1, 2, · · · , N t = 1, 2, · · · , T (8-13) 固定效应模型 问题 8.1 最小二乘融合方法的问题在于常数截距和常数斜率的假设可能性不合理。最显 然的推广方法是引进允许截距项随时间和截面单位变化的虚拟变量。 Yit = α + βXit + γ2 W2t + · · · + γN WN t + δ2 Zi2 + · · · + δT ZiT + εit (8-14) 其中,如果是第 i 个个体 i = 2, · · · , N ,Wit = 1;如果是第 i 个时段 i = 2, · · · , N ,Zit = 1。 在模型中添加了 (N − 1) + (T − 1) 个虚拟变量。如果用普通最小二乘法估计模型,所有的 参数估计都会是无偏和一致的。这里的自由度是 N T − 2 − (N − 1) − (T − 1) 或 N T − N − T 。 是否添加虚拟变量可以由统计假设检验决定: (ESS1 − ESS2 )/(N + T − 2) FN +T −2,N T −N −T = ESS2 /(N − T − 2) 注意:虚拟变量的使用不直接确认回归直线随机时间和个体变化的原因;虚拟变量的使用 用掉较多的自由度。 相对于混合估计模型来说,是否有必要建立个体固定效应模型可以通过 F 检验来完成。原 假设是 H0 : 不同个体的模型截距项相同(建立混合估计模型)。备择假设是 H1 : 不同个体的 模型截距项不同(建立个体固定效应模型)。F 统计量定义为: (SSEr − SSEu )/(N − 1) F = (8-15) SSEu /(N T − N − 1) SSEr 表示约束模型混合估计模型,SSEu 表示非约束模型个体固定效应模型的残差平方和。 非约束模型比约束模型多了 N − 1 个被估参数。混合估计模型给出公共截距项。当模型中含有 k 个解释变量时,统计量的分母自由度是 N T − N − k 。 随机 效 应模 型 随机效应模型(或误差成分模型): Yit = α + βXit + εit (8-16) εit = ui + vi + wit 其中假设每一个误差成分相互之间不相关,也不存在自相关,即不横向相关,也不纵向相关。 把固定效应模型中的截距项看成两个随机变量,一个时间序列变量和一个截面变量,通过 这样的分解就能看出随机效应模型和固定效应模型之间的关系。在固定效应模型中假设截距项 - 149 - 8.3 数据类型非经典的计量经济学模型:面板数据模型 包含了随机时间序列变量和截面变量的平均效应,并且关于这个均值的离差分别就是误差成分 ui 和 vi ,这就是随机效应模型。 2 V ar(εit ) = σu2 + σv2 + σw (8-17) 随机效应模型可以看作是介于零混合误差成分(固定效应模型)和无限大混合误差成分(普通 最小二乘融合数据模型)两个极端之间的中间模型。 误差项与解释变量不相关的假设可以用 Hausman 确认检验法进行检验,该检验比较固定 效应模型的参数估计和随机效应模型的广义最小二乘估计。 可以把随机效应模型作为广义最小二乘回归来估计。用观测值方差的倒数作为观测值的权 重。为了加权,采用两阶段估计法。第一阶段用普通最小二乘法和所有的混合数据进行估计, 或采用固定效应模型,用估计的残差计算各误差成分的样本方差。第二阶段用这些估计方差得 到参数的广义最小二乘估计。 相对于混合估计模型,是否有必要建立个体随机效应模型的检验是: H0 : σu2 = 0混合估计模型 H1 : σu2 6= 0个体随机效应模型 统计量是: PN ³PT ´2 t=1 ûit N T i=1 LM = PN PT 2 2(T − 1) i=1 t=1 ûit − 1 = NT 2(T − 1) à !2 ¯ T 2 ˆ¯u0û −1 û0 û (8-18) (8-19) ¯ 表示由个体随机效应模型计算的残差平方和,û0 û 表示由混合估计模型计算的残差平 其中 ˆ¯u0û 方和。统计量服从自由度为 1 的卡方分布。 例子 例 8.1 专利申请和研究开发支出。用 45 个公司 7 年间的平行数据估计专利申请的对数 与研究开发支出之间的关系,其中研究开发数据有 5 年滞后。基本的回归模型为 Pit = β0 + β1 RN Di,t−5 + εit 以混合数据集进行普通最小二乘估计。 - 150 - 第八章 横截面时间序列模型 源 代 码 8.1 1 2 3 4 5 6 7 8 SAS:混合回归 DATA TEMP; SET LI.RND; P=LOG(P); RUN; /∗OLS Estimation∗/ PROC REG DATA=TEMP; MODEL P=RND; RUN; 这个回归结果说明在研究开发支出与专利申请之间存在很强的正相关关系。 不同公司专利行为的表现之间有很大不同,对专利平均数(以时间平均)对平均研究开发 支出进行回归。 源 代 码 8.2 1 2 3 4 5 6 7 8 9 10 11 12 13 SAS:截面回归 DATA RND; SET LI.RND; P=LOG(P); RUN; PROC MEANS DATA=RND NORPRINT; CLASS CODE; VAR P RND; OUTPUT OUT=A SUM=TOTAL MEAN=MP MR; RUN; DATA TEM; SET A; IF N =1 THEN DELETE; RUN; PROC REG DATA=TEM; MODEL MP=MR; RUN; 这个模型只能表现研究开发支出差异所引起的公司专利申请上的差异,无法表现引起专利申请 差异的其他原因。为判明这个问题,向模型添加一组截面虚拟变量,即估计一个固定效应模 型: - 151 - 8.3 数据类型非经典的计量经济学模型:面板数据模型 源 代 码 8.3 SAS:固定效应模型 DATA TEMP; 2 SET LI.RND; 3 P=LOG(P); 4 RUN; 1 5 6 7 8 9 10 11 12 13 14 15 16 %MACRO A; %DO I=2 %TO 45; DATA TEMP; SET TEMP; B=7∗%EVAL(&I); A=B−6; IF A <= N <= B THEN W&I=1; ELSE W&I=0; OUTPUT; RUN; %END; %MEND A; 17 %A PROC REG DATA=TEMP; 20 MODEL P=RND W2−W45; 21 RUN; 18 19 22 23 24 25 26 27 28 29 30 31 32 33 34 /∗F test∗/ PROC REG DATA=TEMP NOPRINT OUTEST=A; M1:MODEL P=RND W2−W45 /SSE; M2:MODEL P=RND /SSE; RUN; DATA NULL ; SET A; IF FIRST. SSE THEN CALL SYMPUT(’ESS2’, SSE ); ELSE CALL SYMPUT(’ESS1’, SSE ); RUN; DATA NULL ; Q1=FINV(0.95,50,269); Q2=((&ESS1−&ESS2)/50)/(&ESS2/269); PUT Q1= Q2=; RUN; 估计含有截面误差成分和混合误差成分的随机效应模型: 源 代 码 8.4 SAS:随机效应模型 为什么使用综列数据? (1) 综列数据与一定时期内的个体等有关,那么这些个体中一定存在差异性。综列数据估计的 技巧能够通过对特定个体变量的考虑而将这种差异性非常清晰地加以研究。 (2) 综列数据提供更加有价值的数据,变量之间增加了多变性和减少了共线性,并且提高了自 由度和有效性 - 152 - 第八章 横截面时间序列模型 (3) 综列数据更适用于变化中的动态的研究 (4) 综列数据能够更好地检测和度量单纯使用横截面数据或时间序列数据无法观测到的影响 (5) 综列数据能够使我们对更加复杂的行为模型进行研究。 (6) 综列数据适用于大量个体单位,将偏差降到最低。 - 153 - 第九章 非参数回归计量经济学模型理论与方法 9.1 前言 一组数据的最基本的信息就是次序.如果可以把数据点按大小次序排队,每一个具体数目 都有它的在整个数据中(从最小的数起)的位置或次序,称为该数据的秩 秩(rank)。数据有多少个 观察值,就有多少个秩.在一定的假定下,这些秩和它们的统计量的分布是求得出来的,而且 和原来的总体分布无关.这样就可以进行所需要的统计推断。 定义 9.1 (顺序统计量) 对于样本 X1 , X2 , · · · , Xn ,如果按照升幂排列,得到 X(1) ≤ X(2) ≤ · · · ≤ X(n) 则称 X(k) 是顺序统计量。 定义 9.2 (顺序统计量分布函数) 设总体的分布函数是 F (x),则第 r 个顺序统计量的分 布函数是: Fr (x) = P (X(r) < x) = P (至少r个Xi 小于或等于x) n X = Cni F i (x)[1 − F (x)]n−i i=r = 顺序统计量分布函数与密度函数: n! Fr (x) = (r − 1)!(n − r)! F Z(x) tr−1 (1 − t)n−r dt 0 n! fr (x) = F r−1 (x) [1 − F (x)]n−r f (x) (r − 1)!(n − r)! 9.2 非参数统计讲义 [21]. 计 数 统 计 量 和 秩 统 计 量 定义 9.3 设随机变量 X1 , X2 , · · · , Xn 是来自总体 F (x) 的样本,一切可能的 F (x) 组成分 布类 F 。如果统计量 T (X1 , X2 , · · · , Xn 对任意的 F ∈ F 均有相同的分布,则称 T 关于 F 是 适 应任 意 分布 的 (distribution-free)。 在做假设检验时,我们总要找一个对原假设 H0 包含的分布类是适应任意分布的统计量。 当考虑大样本统计推断时,还会考虑渐近适应任意分布的统计量。 定义 9.4 设随机变量 X1 , X2 , · · · , Xn 是来自总体 F (x) 的样本,一切可能的 F (x) 组成分 布类 F 。如果统计量 T (X1 , X2 , · · · , Xn 对任意的 F ∈ F 均有相同的极限分布,则称 T 关于 F 是渐 渐近适 应 任意 分 布的 (distribution-free)。 定义 9.5 设 X 是一个随机变量,对一给定的实数 θ0 ,定义随机变量 Ψ = ψ(X − θ0 ) - 154 - 第九章 非参数回归计量经济学模型理论与方法 其中 ½ ψ(t) = 1 t>0 0 t<0 随机变量 Ψ 称为 X 按 θ0 分段的计 计数 统 计 量 。 定理 9.1 设随机变量 X1 , X2 , · · · , Xn 相互独立。Xi 有分布 Fi (x)。又对任意 i 均有 Fi (θ0 ) 均有 Fi (θ0 ) = p0 ,则 Ψ = ψ(Xi − θ0 是相互独立同分布的随机变量,其共同分布是参数为 (1 − p0 ) 两点分布。 符 号 检验 在实际工作中常用于对比检验。检验用计数统计量是 n n X X B= Ψi = ψ(Xi ) i=1 i=1 1 1 H0 : F (0) = H1 : F (0) 6= 2 2 利用符号统计量可以构造总体中位数的置信区间。 定义 9.6 设 Z1 , Z2 , · · · , Zn 是来自连续分布 F (z) 的简单随机样本,Z(1) ≤ Z(2) ≤ · · · ≤ Z(N ) 为次序统计量,定义随机变量 Ri = r, 当Zi = Z(r) i = 1, 2, · · · , N 当 Ri 是唯一确定时,称样本观测值 Zi 有秩 秩 Ri 。它是第 i 个样本单元 Zi 在样本次序统计量 (Z(1) , Z(2) , · · · , Z(N ) 中的位置。 定义 9.7 (秩统计量) 设 x1 , · · · , xn 为两两互不相等的实数。若在 x1 , · · · , xn 中恰好有 ri 个的值不超过 xi ,则称 ri 为 xi 在 xi , · · · , xn 中的秩。若 X1 , · · · , Xn 为来自单个连续型总体的 样本,或来自多个连续型的合样本,Ri 国 Xi 在 (X1 , · · · , Xn ) 中的秩,则称 R = (R1 , · · · , Rn ) 为 (X1 , · · · , Xn ) 的秩 秩统 计 量 。 定理 9.2 记 R = (R1 , R2 , · · · , RN ),集合 R = {(r1 , · · · , rN )|(r1 , · · · , rN )是(1, · · · , N )的一个排列} 则 R 在 R 上均匀分布。 仅依赖 R 的统计量 S(R) 关于连续分布构成的分布类是适应任意分布的。 1 N! 1 P {Ri = r} = N P {R = r} = P {Ri = r, Rj = s} = 1 N (N − 1) tm,n (d) 表示从 1, 2, · · · , m + n 中取 n 个数其和恰好为 d 的可能取法的个数。计算 tm,n (d) 可利用下列递推公式: tm,n (d) = tm,(n−1) (d − m − n) + t(m−1),n (d) ti,0 (0) = 1; ti,0 (d) = 0 t0,j ( j(j + 1) ) = 1; t0,j (d) = 0 2 - 155 - 9.3 Histogram 绝对 定义 9.8 随机变量 |X1 | , · · · , |Xn | 对应的秩向量记为 (R+ , · · · , Rn+ ),Ri+ 称为 Xi 的绝 + 秩 ,Ψi Ri 称为 Xi 的符 符号 秩 。 只依赖于 Ψ1 , · · · , Ψn , R+ 的统计量 S(Ψ1 , · · · , Ψn , R+ ),对于关于 0 点对称的连续分布构成 的分布类是适应任意分布的。 任 一 由 Ψ1 , · · · , Ψn 构 成 的 统 计 量 S(Ψ1 , · · · , Ψn ) 关 于 一 切 p0 分 位 点 为 θ0 (θ0 是 连 续 点,Fi (θ0 ) = p0 )的分布类是适应任意分布的。 9.3 Histogram Statistical Properties the histogram as an estimator of the unknown pdf f (x) the origin x0 = 0 some point x ∈ Bj = [(j − 1)h, jh) the density estimate assigned by the histogram to x is n 1 X ˆ fh (x) = I(Xi ∈ Bj ) nh i=1 Bias Is the histogram an unbiased estimator? n 1 X E{fˆh (x)} = E{I(Xi ∈ Bj )} nh i=1 Xi is i.i.d =⇒ the indicator function I is i.i.d 1 nE(I(Xi ∈ Bj )) E{fˆh (x)} = nh ( R jh 0 p is 1 − (j−1)h f (u)du R jh I(Xi ∈ Bj ) = 1 p is (j−1)h f (u)du hence it is Bernoulli distributed: E{I(Xi ∈ Bi )} = P {I(Xi ∈ Bi } Z h = f (u)du (j−1)h then 1 E(fˆh (x)) = h Z h f (u)du (j−1)h the last term is not in general equal to the f (x) hence, the histogram is in general not an unbiased estimator of the f (x): Bias(fˆh (x)) = E(fˆh (x) − f (x)) Z 1 h = f (u)du − f (x) h (j−1)h Z 1 h = [f (u) − f (x)]du h (j−1)h a first-order Taylor approximation of f (x) − f (u) around the center mj = (j − 12 )h yields: Bias(fˆh (x)) ≈ f 0 (mj )(mj − x) if mj is equal to the x? - 156 - 第九章 非参数回归计量经济学模型理论与方法 Variance 1 V ar{fˆh (x)} = 2 2 n n h ≈ integral: à Z f (u)du 1 − Bj f (u)du Bj 1 f (x) nh Z b f (x)dx = lim n X λ→0 a ! Z f (ξi )∆xi i=1 Mean squared error Variance and bias vary opposite directions with h,we have to settle for finding the value of h that yields the optimal compromise between variance and bias reduction. the mean squared error(M SE) of the histogram: M SE{fˆh (x)} = E{[fˆh (x) − f (x)]2 } which can be written as the sum of the variance and the squared bias: M SE{fˆh (x)} = V ar(fˆh (x)) + [Bias(fˆh (x))]2 Mean integrated squared error the application of the !M SE is difficult in practice since the derived formula for the M SE depends on the unknown density function f both in the variance and the squared bias term. the most widely used global measure of estimation accuracy is the meanintergratedsquarederror: hR i +∞ ˆ 2 ˆ M ISE(fh (x)) = E −∞ {fh (x) − f (x)} dx R +∞ = −∞ E[{fˆh (x) − f (x)}2 ]dx R +∞ = −∞ M SEdx R 1 M ISE(fˆh (x)) ≈ nh f (x)dx RP 1 2 I(x ∈ Bj ){(j − 2 )h − x} [f 0 {(j − 21 )h}]2 dx + j PR 1 1 1 2 0 2 = nh + Bj {(j − 2 )h − x} [f {(j − 2 )h}] dx R Pj 1 ≈ nh + [f 0 {(j − 12 )h}]2 • Bj {x − (j − 21 )h}2 dx j 2 R 1 ≈ nh + h12 {f 0 (x)}2 dx 2 1 h → 0 nh + h12 kf 0 k22 the asymptotic of M SE : ° 1 h2 ° °f 0 °2 AM SE(fˆh (x)) = + 2 nh 12 optimal Binwidth differentiating AM SE with respect to h gives: ∂AM SE(fˆh (x)) = − nh1 2 + 61 h kf 0 k22 ∂h =0 hence à h0 = 6 n kf 0 k22 !1 3 1 ∼ n− 3 assuming a standard norm distribution: 1 x2 f (x) = ϕ(x) = √ exp(− ) 2 2π - 157 - 9.4 Nonparametric density estimation and f 0 (x) = (−x)f (x) = √12π kf 0 k22 = k(−x)f (x)k22 R 1 = { x2 f 2 (x)dx} 2 ×2 R 2 = √12π x2 √12π exp(− x2 × 2)dx R 2 × √1 × x2 √1 × √1 1 × exp(− x 1 )dx 2 2π 1 √ 2 2× 2 =4 π Dependence of the histogram on the origin this property strongly conflicts with the goal of nonparametric statistics to ”let the data speak for themselves” ASH:averaged shifted histogram n M −1 1X 1 XX fˆh (x) = { I(Xi ∈ Bjl )I(x ∈ Bjl )} n Mh i=1 l=0 j 9.4 Nonparametric density estimation motivation and derivation even if the ASH seemed to solve the choice-of-an-origin problem the histogram retains some undesirable properties: (1) the histogram assigns each x in [mj − h2 , mj + h2 ) the same estimator of the pdf ,namely fˆh (mj ).This seems to be overly restrictive. (2) The histogram is not a continuous function but has jumps at the boundaries of the bins. {observations that fall into a small interval containing x } {observations that fall into a small interval around x } we consider intervals of the form [x − h, x + h): 1 fˆh (x) = #{Xi ∈ [x − h, x + h)} 2hn the formula can be rewritten if we use a weighting function ,called the uniform kernel function: 1 K(u) = I(|u| ≤ 1) 2 and let x − Xi u= h we can write: 1 P i fˆh (x) = nh K( x−X h ) n i=1 n ¯ ¯ 1 P 1 ¯ x−Xi ¯ ≤ 1) = nh 2 I( h i=1 maybe we should give more weight to contributions from observations very close to x than to those coming from observations that are more distant. for instant,Epanechniko kernel: 3 K(•) = (1 − u2 )I(|u| ≤ 1) 4 - 158 - 第九章 非参数回归计量经济学模型理论与方法 based on a random sample {X1 , X2 , · · · , Xn } from f 1 fˆh (x) = n n X Kh (x − Xi ) i=1 where 1 • K( ) h h h controls the smoothness of the estimate and the choice of the h is a crucial problem. Kh (•) = the rescaled kernel function is simply: 1 x − Xi 1 K( ) = K(x − Xi ) nh h n Z Z 1 x − Xi 1 1 K( )dx = hK(u)du = nh h nh n Statistic Properties Bias Bias{fˆh (x)} = E{fˆh (x)} − f (x) n P = n1 E{Kh (x − Xi )} − f (x) i=1 = E{Kh (x − X)} − f (x) R = h1 K( x−u h )f (u)du − f (x) a second-Taylor expansion of f (u) around x: h2 00 f (x)µ2 (K) + o(h2 ) Bias{fˆh (x)} = 2 Z µ2 (K) = s2 K(s)ds the bias is proportional to h2 .moreover,the bias is depend on the curvature of the density at x. Variance V ar{fˆh (x)} n P = V ar{ n1 Kh (x − Xi )} i=1 = n1 V ar{Kh } = n1 {EKh2 − (EKh )2 } using EKh = f (x) + o(h) and Z EKh2 = Kh2 f (u)du and variable substitution and Taylor expansion arguments in the derivation of the bias: 1 1 V ar{fˆh (x)} = kKk22 f (x) + o( ) nh nh R kKk22 is shorthand for K 2 (s)ds,the squared L2 norm of K. MSE M SE{fˆh (x)} 4 1 1 = h4 f 00 (x)2 µ2 (K)2 + nh kKk22 f (x) + o(h4 ) + o( nh ) - 159 - 9.5 无参数回归模型 ho pt(x) depends on x and is thus a local bandwidth. AMSE Z AM SE = M SEdx AM SE R = M SEdx 4 1 kKk22 + h4 {µ2 (K)}2 kf 00 k 22 = nh differentiating AM SE with respect to h and solving the first-order condition for h yields the AM SE optimal bandwidth: à !1/5 1 kKk22 hopt = ∼ n− 5 2 2 kf 00 k2 {µ2 (K)} n AM SE(fˆhopt ) = 54 (kKk22 )4/5 (µ2 (K) kf 00 k2 )2/5 AM SE is converging at the rate of n−4/5 ;histogram is converging at the rate of n−2/3 9.5 无参数回归模型 经典计量经济学模型首先根据经济理论和样本数据设定模型的函数关系,然后估计关系参 数并检验所设定的关系。如果模型的函数关系通过检验被证明是成立的,那么回归结果可以外 延,其推断有较高的精度,模型的参数一般具有明确的经济意义,可以方便于各方面的应用。 但关于模型及参数的一些假定在现实中未必成立。例如 C − D 生产函数模型假定技术进步是中 性的、技术进步独立于要素投入量的变化、要素替代弹性为1、具有一次齐次性即不变规模报 酬等,这些假定在现实中很难同时成立。因而当模型及参数的假定与实际背离(也包括模型的 随机干扰项的正态性假定与实际背离)时,就容易造成模型设定误差。此时,基于经典假设模 型所作出的推断的表现可能很差,这就促使人们寻找别的出路,而无参数回归模型则是朝着这 个方向的一种努力。 无参数回归模型的估计方法有三大类,一是权函数方法,二是最小二乘估计,三是稳健估 计。无参数回归模型的特点是:回归函数的形式可以任意,没有任何约束,解释变量和被解释变 量的分布也很少限制,因而有较大的适应性,但无参数回归结果外延困难。无参数技术的目的 是放松回归函数形式的限制,为确定或建议回归函数的参数表达式提供有用的工具。无参数技 术并不能取代参数技术,两者相结合将会得到用单一方法无法获得的结论。 定义 9.9 (无参数回归模型) 无 参 数 回 归 模 型 指 对 Y 对 X 条 件 回 归 函 数 m(x) = E(Y |X = x) x ∈ Rq 依据样本 {(Xi , Yi )ni=1 } 进行估计,得出 m̂n (x)。如果 X 是随机变 量,且联合密度函数 f (X, Y ) 存在,则模型可表示为 Z m(x) = yf (x, y)dy/f (x) f (x) 是 X 的边缘密度函数;如果 X 是确定性变量,模型可表示为 Yi = m(xi ) + εi 权 函 数 方 法 非参数回归的基本方法有核函数法,最近邻函数法,样条函数法,小波函数 法。这些方法尽管起源不一样,数学形式相距甚远,但都可以视为关于 Yi 的线性组合的某种 权函数。也就是说,回归函数 g(X) 的估计 gn (X) 总可以表为下述形式: n X gn (X) = Wi (X)Yi i=1 - 160 - 第九章 非参数回归计量经济学模型理论与方法 其中 {Wi (X)} 称为权函数。在一般实际问题中,权函数都满足下述条件: n X Wi (X; X1 , · · · , Xn ) > 0, Wi (X; X1 , · · · , Xn ) = 1 i=1 权函数方法的系统研究始于 Stone(1977)。 核 函数 法 N adaraya(1964)及 W atson(1964) 提出了一种既适合解释变量是确定性变量,也 适合解释变量是随机变量的核估计: 选定概率密度 Z K(u)du = 1 为核函数及窗宽 h > 0。定义核权函数 Wni (x) = Kh (x − Xi )/ n X Kh (x − Xj ) j=1 其中 Kh (u) = 1 u K( ) h h 是一个概率密度函数。 N adaraya − W atson 核估计是 Pn Kh (x − Xi )Yi m̂n (x) = Pi=1 n j=1 Kh (x − Xj ) 核估计等价于局部加权最小二乘估计。 µ Wi (X; X1 , · · · , Xn ) = K X − Xi an ¶ X ¶ n µ X − Xi / an i=1 ³ Y = g(X) = n X Wi (X)Yi = i=1 n X i=1 K n P j=1 X−Xi an ³ K ´ X−Xi an ´ Yi 核 函 数 直 方 图 估 计 密 度 密度估计最基本的方法是直方图估计。先用点 {ai }ki=1 把直线划 分为 k 个小区间,计数区间的端点和宽度都是固定的。记 Ni 为样本点 X1 , X2 , · · · , Xn 落在第 i 个计数区间 [ai , ai+1 ) 的个数。则密度函数 f (x) 在区间 [ai , ai+1 ) 的函数估计值是: Ni , ai 6 x < ai+1 , i = 1, · · · , k fn (x) = n(ai+1 − ai ) 计数 区 间端 点可变 这样的直方图估计当然是阶梯函数,于是人们想法改进它。这种直方图 估计方法在估计中心比较精确而在估计区间的端点处精度较差。有人提出,对每个 x,各作一 个以 x 为中点的小计数区间 [x − h, x + h],再对落在该区间的样本点进行计数,设为 N (x, h), 则密度估计为: N (x, h) fn (x) = 2nh 这个想法与直方图不同在于它的计数区间端点划分不是固定的,而是随 x 而变,可以自始至终 保持 x 点在计数区间中间。计 计数区 间 宽度 可 变 不过此时计数区间宽度 hn 一般是固定的。如果 引进函数: 1 −16x<1 K(x) = 2 0 else - 161 - 9.5 无参数回归模型 则上述变端点计数区间的密度估计可写为 n 1 X fn (x) = K nh i=1 µ x − Xn h ¶ 后来 P arzen(1962) 提出,可以将这种矩形核函数形式放宽限制,只须积分为 1 (最好还为恒 正)即可。这就导出了密度的核估计。核 核函数 性 质 一般来说,要求核函数满足: Z +∞ K(x) > 0, K(x)dx = 1 −∞ Z +∞ K 2 (x)dx < +∞ sup K(x) < +∞, −∞ lim K(x) · x = 0 x→∞ 对于窗宽,显然样本点越多,窗宽越小,即窗宽是样本点的函数: lim h(n) = 0, lim nh(n) = n → ∞ x→∞ n→∞ 在上述要求的核函数及窗宽条件下,密度 f (x) 的核估计 fn (x) 是 f (x) 的渐近无偏估计与相合 估计。 密 度 核 估计 条件回归函数的导数期望估计 ADE(Averagederivativeestimation) 经验分布函数为: Fn (x) = 1 (X1 , X2 , · · · , Xn 中小于x的个数) n 取核函数为均匀核: ½1 2 K0 (x) = 密度函数估计为 0 if − 1 6 x < 1 else fˆn (x) = [Fn (x + h) − Fn (x − h)]/2h Z x+h 1 = dFn (t) 2h x−h Z +∞ 1 x−t = K0 ( )dFn (t) h −∞ h n 1 X x − Xi = ) K0 ( nh h i=1 一般密度核估计: n 1 X x − Xi fˆn (x) = K( ) nh h i=1 回归函数的导数的核估计采用 P riestley − Chao 核权定义为 n X x − Xi (k) −(k+1) m̂n (x) = h (Xi − Xi−1 )K (k) ( )Yi h i=1 P 维随机向量的核函数估计为 n 1 X x − Xi fˆn (x) = K( ) p nh h i=1 最近邻函数法 - 162 - 第九章 非参数回归计量经济学模型理论与方法 (1) 首先引进一个距离函数: 2 ||u − υ|| = n X (ui − υi )2 i=1 或者 ||u − υ|| = max ||ui − υi || 16i6n (2) 为了反映各分量的重要程度,引进权因子 {Ci } 并满足配方条件 (3) 距离函数改进 n X 2 ||u − υ|| = Ci (ui − υi )2 i=1 或者 |u − υ||2 = max Ci |ui − υi | 16i6n 假设有样本 (Yi , Xi ),并指定空间中作任一点 X ,估计回归函数在该点的值: (1) 排序 ||Xk1 − X|| < ||Xk2 − X|| < · · · < ||Xkn − X|| 表示点 Xk1 与 X 的距离最近,依次类推。 (2) 这里的 n 个权函数也满足配方条件,并按从大到小排序 n X k1 > k2 > · · · > kn > 0, ki = 1 i=1 即 Wki (X; X1 , · · · , Xn ) = ki , i = 1, · · · , n (3) 最近邻回归函数 Y = g(X) = n X Wi (X; X1 , · · · , Xn )Yi = i=1 n X i=1 ki Yi = n X ki (X)Yi i=1 权 函 数 估 计 的 矩 相 合 性 如果对样本 (Yi , Xi ), i = 1, 2, · · · , n,构造了权函数 Wi = Wi (X) = Wi (X, X1 , · · · , Xn ),有了回归函数 g(X) 的权函数估计 n X gn (X) = Wi Yi i=1 当 Y 的 r 阶矩存在时,若 lim E|gn (X) − g(X)|r = 0 n→∞ 则称这样的权函数为矩相合的权函数。 在什么样的条件下构造的权函数是矩相合的呢? Stone(1977)提出了很一般的,几乎是充分 必要的条件。 定理 9.3 设概率权 {Wi } 满足下列条件: (1)存在有限常数 C ,使对 Rm 上任何非负可测 函数(连续函数与分段连续函数是最常见的可测函数) f ,必有 à n ! X E Wi f (Xi ) 6 CEf (X) i=1 - 163 - 9.5 无参数回归模型 因为权函数是概率权,必有 |Wi | < 1, i = 1, 2, · · · , n,于是 ¯ à n !¯ n n n ¯ ¯ X X X X ¯ ¯ Wi f (Xi ) ¯ 6 E |Wi | |f (Xi )| 6 E |f (Xi )| = E f (Xi ) ¯E ¯ ¯ i=1 i=1 i=1 i=1 这里常数 C 取值为1。(2) ∀ε > 0,当 n → ∞ 时, n X P Wi I(||Xi −X||>ε) − →0 i=1 (3) 当 n → ∞时 P max Wi − →0 16i6n 则 {Wi } 是矩相合的权函数。 引理 9.1 ∞,则 设概率权函数{Wi } 适合定理条件(1)和(2),又对某个 r,有 E|f (x)|r < lim E à n X n→∞ ! Wi (X) |f (Xi ) − f (X)|r =0 i=1 M = sup |f (X)| X 由条件(2),上式右边第二项依概率收敛于0且不大于1。依控制收敛定理有 à n ! X lim E Wi (X)I(||Xi −X)>ε = 0 n→∞ 故存在 n0 ,当 n > n0 ,有: E i=1 à n X ! Wi (X)I(||Xi −X)>ε 6 i=1 有: E à n X η 2 ! Wi (X)|f (Xi ) − f (X)|r 6η i=1 对一般的函数 f ,取一个在 Rm 上连续且在一有界域外为零的函数 f˜,使 E|f˜(X)|2 < ∞,且 E|f (x) − f˜(x)|r < η 。因为: à n ! (à n ! X X r E Wi (X) |f (Xi ) − f (X)| 6 3r−1 Wi (X)|f (Xi ) − f˜(X)|r i=1 +E à n X i=1 ! Wi (X)|f˜(Xi ) − f (Xi )|r +E i=1 à n X !) Wi (X)|f˜(X) − f (X)|r i=1 第一项根据条件(1)不超过 ¯ ¯r ¯ ¯ CE ¯f˜(X) − f (X)¯ < Cη 当n → ∞,第二项将趋近于零。第三项等于 ¯ ¯r ¯ ¯ E ¯f˜(X) − f (X)¯ < η 。因此, lim E n→∞ 。 à n X ! Wi (X)|f (X) − f (Xi )|r i=1 - 164 - 6 3r−1 (C + 1)η 第九章 非参数回归计量经济学模型理论与方法 定理 9.4 (Lebesgue控制收敛定理) 设 fn (x) 为 E 上可测函数列, lim fn (x) = f (x) a.e E n→∞ 且存在非负可积函数 F (x),使得 fn (x) 6 F (x) a.e E 则 f (x) 在 E 上可积,且 Z Z lim n→∞ E 引理 9.2 fn (x)dx = lim fn (x)dx E n→∞ 设 {Wi } 为满足定理三个条件的概率权,函数 f 非负且 Ef (x) < ∞,则有: à n ! X lim E Wi2 (X)f (xi ) = 0 n→∞ i=1 0 0 证明:定义一组新的概率权函数 Wi = Wi2 ,因为 0 ≤ Wi ≤ 1,所以 0 ≤ Wi2 ≤ 1。由上一 个引理我们有: à n ! X lim E Wi2 (X) |f (x) − f (xi )| = 0 n→∞ i=1 由定理中的条件三和 0 ≤ Wi2 ≤ 1 我们有: n n X X P 2 Wi 6 ( max Wi ) Wi = max Wi − →0 16i6n i=1 由控制收敛定理有: lim E à n X n→∞ 16i6n i=1 ! Wi2 (X)f (X) =0 i=1 窗宽 选择窗宽的交错鉴定方法、惩罚函数法和插入法。 平方拟合误差 p(h) = n−1 n X (Yi − m̂n (Xi ))2 w(Xi ) i=1 使平均平方误差最小: dA (h) = n −1 n X (m̂n (Xi ) − m(Xi ))2 w(Xi ) i=1 p(h) = n −1 n X ε2j w(Xj ) + dA (h) − 2n−1 j=1 n X εj (m̂n (Xj ) − m(Xj ))w(Xj ) j=1 最后一项可重写为: C1n (h) = −2n−1 n X " εj n−1 j=1 其在给定 X 下的条件期望为 −2n −1 n X n X # Wni (Xj )Yi − m(Xj ) w(Xj ) i=1 [n−1 Wnj (Xj )σ 2 (Xj )]w(Xj ) j=1 稳健估计 最 小 二 乘 估 计 最小二乘法是确定性解释变量无参数回归模型估计的一种主要方法,主要有 正交序列估计、样条估计和小波估计。 - 165 - 9.5 无参数回归模型 正交序列估计 样条估计 小波估计 局 部 多 项 式 回 归 估 计 正交序列估计和样条估计都需要估计出一系列的参数。为了减少参 数估计的个数,可以采用局部线性回归估计,即对于给定的 x,认为 m(x) 在 x 的局部邻域近 似于线性的。 一元 局 部多 项 式回 归 假设 m(x) 在 x0 处 p + 1 阶导数存在,进行台劳展开: m(p) (x0 ) m(x) ≈ m(x0 ) + m0 (x0 )(x − x0 ) + · · · + (x − x0 )p p! 从而 Yi = m(x0 ) + m0 (x0 )(Xi − x0 ) + · · · + m(p) (x0 ) (Xi − x0 )p + εi p! 用加权最小二乘法进行局部拟合,即最小化 p n X X |Xi − x0 | {Yi − βj (Xi − x0 )j }2 Kh (Xi − x0 )I( 6 1) h i=1 j=0 若 K(·) 是 [−1, 1] 上的核函数,上式可简写为 p n X X {Yi − βj (Xi − x0 )j }2 Kh (Xi − x0 ) i=1 j=0 矩阵形式是 Y = Xβ + ε 其中 Y1 1 X1 − x0 · · · (X1 − x0 )p Y2 1 X2 − x0 · · · (X2 − x0 )p Y = . X=. .. .. .. . . . . . . . 1 Xn − x0 · · · (Xn − x0 )p ε1 ε2 ε= . .. εn Yn β0 β1 β= . .. βp 参数 β 的加权最小二乘估计是: min(Y − Xβ)0 W (Y − Xβ) β β̂ = (X 0 W X)−1 X 0 W y 其中 W = diag{Kh (Xi − x0 )} 局 部 回 归 方 法 的 优 点 局部多项式拟合从理论和实践上都是吸引人的。第一,传统回归方 法将经济变量局部上的变化差异掩盖了,因而无法反映经济现象的结构变化。传统回归方法处 理有结构变化的经济变量之间关系时常用的手法是引入虚拟变量,但虚拟变量只能反映两个时 期或若干已知时期经济现象的结构变化。而局部回归的结果能够动态地反映经济现象的结构变 化。 第二,以往根据经济理论建立的线性或非线性计量模型,隐含着若干假设条件。例 如,C − D 生产函数,隐含着技术中性、规模报酬不变等假设。而这些隐含条件对于具体问题 - 166 - 第九章 非参数回归计量经济学模型理论与方法 不一定符合。局部回归假定变量之间的关系未知,因而没有隐含任何假设条件,所以更加符合 实际。 第三,其它普遍使用的核估计,如 N adaraya − W atson 估计导致不必要的偏差,而 Gasser − M jller 估计在处理解释变量为随机性变量时有较大的方差。 第四,局部回归方法既适合于解释变量为确定性变量的固定设定模型,也适合于解释变量 为随机性变量的随机设定模型。 第五,局部回归方法适合于随机设定模型解释变量分布均匀情形,也适合于分布不均匀的 情形。 第六,局部多项式拟合不必进行边界修正,它在边界的偏差自动与内部的偏差有相同的 阶。在处理多维情况时,这是一个重要的优点。因为多维情况的边界相当大,其它估计方法在 进行边界修正非常困难。 第七,局部多项式回归估计在所有线性估计中,在极小极大效率(M inimaxef f iciency)意 义上接近于最优,它的有效性为 100%。 偏 和方 差 其中 表 9-1 m(x) 的核回归估计的逐点渐近偏和方差(F an1992) 方法 偏 N adaraya − W atson 00 (m Gasser − M jller 局部线性回归 2 bn = h2 记 方差 0 0 (x) (x) + 2m f(x)f )bn (x) n m (x) mn (x) R∞ 2 σ (x) 2 −∞ u K(u)du Vn = f (x)nh Vn 1.5Vn Vn R∞ 2 −∞ K (u)du R µj = uj K(u)du S = (µj+l )06j,l6p S̃ = (µj+l+1 )06j,l6p R vj = uj K 2 (u)du cp = (µp+1, · · · , µ2p+1 )0 c̃p = (µp+2, · · · , µ2p+2 )0 S ∗ = (vj+l )06j,l6p S −1 = (S jl )06j,l6p 并且 eν+1 = (0, · · · , 0, 1, 0, · · · , 0)0 K(t) 的同等核定义为 ∗ Kv,p (t) = ( p X S vl tl )K(t) l=0 假设 f (x0 ) > 0,且 f (·), σ 2 (·), mp+1 在 x0 的领域内连续,则当 h → 0, nh → ∞ 时, m̂v (x0 ) = v!β̂v 表 9-2 ∗ 核函数 K(t) 的同等核 Kv,p (t) v 0 0 1 2 ∗ Kv,p (t) K(t) 2 −1 2 (µ4 − µ2 ) (µ4 − µ2 t )K(t) µ−1 2 tK(t) 2 −1 2 (µ4 − µ2 ) (t − µ2 )K(t) p 1 3 2 3 - 167 - 9.6 半参数非回归模型 的渐近条件方差为 V ar{m̂v (x0 )|X} (v!)2 σ 2 (x0 ) 1 0 −1 ∗ −1 = ev+1 S S S ev+1 + op( 1+2v ) 1+2v f (x0 )nh nh Z 2 2 (v!) σ (x0 ) 1 ∗ 2 ≈ (Kv,p ) (t)dt + op( 1+2v ) 1+2v f (x0 )nh nh 当 p − v 为奇数时,渐近条件偏为 Bias{m̂v (x0 )|X} v! m(p+1) (x0 )hp+1−v + op(hp+1−v ) = e0v+1 S −1 cp (p + 1)! Z v! ∗ ≈ tp+1 Kv,p m(p+1) (x0 )hp+1−v + op(hp+1−v ) (t)dt (p + 1)! 当 p − v 为偶数,若 f ‘ (·), mp+2 在 x0 的领域内连续,渐近条件偏为 Bias{m̂v (x0 )|X} = e0v+1 S −1 c̃p f 0 (x0 ) p+1−v v! (p+2) (p+1) {m (x0 ) + (p + 2)m (x0 ) }h + op(hp+2−v ) (p + 2)! f (x0 ) 最佳窗宽的选择 9.6 半参数非回归模型 Stone 于 1977 年提出如下回归模型: y = Xβ + g(Z) + ε (9-1) 偏残差估计 估计方法 9.1 偏残差估计方法是由 Denby(1984, 1986) 提出的,分两步进行估计。 光滑样条估计 二阶段最小二乘估计 9.7 小结 (1) 核估计的核心问题就是核权函数的选择和窗宽的选择。核权函数在核估计中起光滑的作 用,即消除扰动的随机因素,使所得曲线反映变量之间的实际经济关系。 - 168 - 第十章 soft 第十章 soft 10.1 Eviews 输入数据 (1) F ile → N ew → W orkf ile (2) 单击右键 → N ewObject → Series (3) F ile → Import → Excel 绘 制 散 点 图 选中要输入的数据 → 右击 → Open → asgroup → V IEW → Graph → Scatter → SimpleScatter 线 性 回 归 选中要输入的数据 → 右击 → Open → asequation view → representation 残 差 图 view → Actual, F itted, Residual → ResidualGraph 怎 样 用 EV iews 通 过 键 盘 输 入 数 据 建立新工作文件的方法是从 EV iews 主菜单中单击 F ile 键,选择 N ew,W orkf ile。 则打开一个数据范围选择框(W orkf ileRange)。需要做出 3 项选择。①选择数据性质。②启 始期(Startdate)。③终止期(Enddate)。3 项选择完毕后,点击”OK” 键。这时,会建立 起一个尚未命名的工作文件(W orkf ile),且处于打开状态。当打开新工作文件或现有工作文 件后,可以通过键盘输入数据和追加数据。具体操作如下: 从 EV iews 主菜单中点击 Quick 键,选择 EmptyGroup 功能。这时会打开一个空白表 格数据窗口(Group)。每一个空格代表一个观测值位置。按列依次输入每一个变量(或 序列)的观测值。键入每一个观测值后,可通过按回车键(Enter 键)或方向指示键进行 确认。按方向指示键的好处是在确认了当前输入的观测值的同时,还把光标移到了下一 个待输入位置。每一列数据上方的灰色空格是用于输入变量名的。给变量命名时,字符 不得超过 16 个。注意:下列名字具有特殊意义,给变量命名时,应避免使用。它们是: ABSACOSARASIN CCON CN ORM ,COEF COSDDLOGDN ORM ELSEEN DIF ,EXP LOGLOGI 回 归输 出 结果 Estimation output 分三部分。 第一部分五行,说明因变量;估计方法;运行时间;样本数据时段;样本个数。 第二部分三行,说明解释变量和常数项的系数估计,系数估计的标准差,t 值和 p 值。 第三部分六行二列: (1) R − squared 样本可决系数,说明模型按拟合程度 (2) AjustedR − squared 调整的样本可决系数 (3) S.E.of regression 回归标准误: r s= ê0 ê T −k (10-1) P (yi − ŷi )2 (4) Sumsquaredresid 残差平方和: (5) Loglikelihood 对数似然比检验: n n n L = − log 2π − log σ̂ 2 − 2 2 2 (6) DurbinW atsonstat DW 统计量,它的值越接近于 2 说明越不存在自相关; (7) M eanDependentvar 因变量的均值; - 169 - (10-2) 10.2 点预测 Point Forecasts (8) S.D.Dependentvar 因变量的标准差; (9) Schwarzcriterion 施瓦茨准则 (10) Akaikeinf ocriterion 赤池信息准则 (11) F − statistic F 统计量 (12) P rob(F − statistic) F 的 p 值 样 本期 内 预测 Equation 界面选择 P roc → F orecast。 10.2 点预测 Point Forecasts 调整样本范围:在显示各序列的界面下右击界面的 Range 和 Sample 列所在部分,调整样 本结构。 单击解释变量序列,输入数据。 重复方程估计与预测。 在序列界面中单击被解释变量序列名,可以看到预测值。预 预测 结 果 的 评 价 指 标 (1) 均方根误差 RM SE: v u u t s+h 1 X (ŷt − yt )2 h + 1 t=s (10-3) s+h 1 X |ŷt − yt | h + 1 t=s (10-4) ¯ s+h ¯ 1 X ¯¯ ŷt − yt ¯¯ h + 1 t=s ¯ yt ¯ (10-5) (2) 平均绝对误差 M AE: (3) 平均相对误差 M AP E: (4) 泰尔不等系数 T heilInequalityCoef f icient: q 1 P 2 t=s s + h(ŷt − yt ) h+1 q q 1 Ps+h 2 1 P 2 ŷ + t=s t t=s s + hyt h+1 h+1 (5) 偏差比 BiasP roportion: (10-6) (ŷ¯ − bary)2 P (ŷt − yt )2 /h (10-7) (s − sy )2 P ŷ (ŷt − yt )2 /h (10-8) 2(1 − r)sŷ sy ± P (ŷt − yt )2 h (10-9) (6) 方差比 V arianceP roportion: (7) 协方差比 CovarianceP roportion: - 170 - 第十章 soft 求 相 关系 数 矩阵 (1)点击!Quick 键并依次选择 GroupStatistics, Correlations,将出现一个 要求填写序列名的对话框(SeriesList),填好序列名后按 OK 。(2) 在 W orkf ile 窗口中用鼠 标选中序列名, 点击 Show 键, OK 键,从而打开数据组( Group ) 窗口。在数据组窗口点击 V iew 键选择 Correlations。 montecalor EVIEWS: workfile mc u 1 10 !b1=25 !b2=0.5 matrix(100,2)f vector(10)v1 v1.fill 80,100,120,140,160,180,200,220,240,260 mtos(v1,x) for !k=1 to 100 series u=3*nrnd series y=!b1+!b2*x+u equation eql.ls y=c(1)+c(2)*x f(!k,1)=c(1) f(!k,2)=c(2) next show f expand 1 100 smpl 1 100 mtos(f,gr) freeze ser01.qqplot freeze ser01.hist freeze ser02.qqplot freeze ser02.hist matrix(1,2)m m(1,1)=@mean(ser01) m(1,2)=@mean(ser02) show m 10.3 Maple 10.4 matlab 统 计 工 具 箱 自然界和社会上会发生各种各样的现象,其中有的现象在一定条件下是一定要 发生的,有的则表现出一定的随机性,但总体上又有一定的规律可循。一般称前者为确定性事 件,后者为不确定性事件(或称随机事件)。概率论和数理统计就是研究和揭示不确定事件统 计规律性的一门数学学科。作为一门实用性很强的数学分支,概率论和数理统计的理论和方法 已经广泛应用于管理、经济、心理、教育、体育、医学、生物、化学、机械、水文、地质、林 - 171 - 10.4 matlab 表 10-1 命令 dsolve rsolve pdsolve PDEplot pdetest odetest mapde 用途 解微分方程 解差分方程 求解偏微分方程 画一阶偏微分方程 验证偏微分方程解 检验常微分方程解 转移偏方程形式 用法 dsolve(DE,v) rsolve(eqn,v) pdsolve(PDE,v) PDEplot(PDE,int,strange,options) pdetest(sol,PDE) odetest(sol,ode) mapde(PDE,into,f) 表 10-2 命令 int Doubleint 用途 求解定积分 二重积分 Tripleint 三重积分 微分方程 微积分计算 用法 int(f(x),x=a..b) Doubleint(f(x,y),x,y) 在student 库中;需要附加value() 函数给出结果 Tripleint(f(x,y,z),x,y,z) 业、气象、工业生产、建筑、通讯、自动控制等几乎所有社会和科学技术领域。 M atlab6.0 的 统计工具箱相对于前面一些版本,改进较大。目前已经可以与 SP SS!SAS 等软件的统计功能 相媲美。具体而言,它包括下面几个方面的内容: • 概率分布:给出了常见的 20 种概率分布类型的概率密度函数、累加分布函数(分布函 数)、逆累加分布函数、参数估计函数、随机数生成函数和统计量计算函数。 • 参数估计: 提供了多种分布类型分布参数及其置信区间的估计方法。 • 样本描述: 提供了描述中心趋势和离中趋势的统计量函数,缺失数据条件下的样本描述方 法以及其它一些统计量计算函数。 • 方差分析:包括单因子方差分析、双因子方差分析和多因子方差分析。 • 多元方差分析: 包括单因素多元方差分析、分组聚类和多元比较等。 • 回归分析:包括多元线性回归(包括逐步回归)、岭回归、一般线性模型拟合、多项式拟 合、稳健回归、响应面分析(包括二维响应面分析和多维响应面分析)、非线性回归。 • 假设检验包括单样本 t 检验、双样本 t 检验和 z 检验。 • 分 布 的 检 验:包 括 Jarque − Bera 正 态 性 检 验 、Kolmogorov − smirnov 单 样 本 检 验、Kolmogorov − smirnov 双样本检验和 Lillief ors 正态性检验。 • 非参数检验: 包括 f riedman 检验、 Kruskalwallis 检验、秩和检验、符号秩检验和符号 检验。 • 判别分析 • 聚类分析 • 因子分析 • 统计过程控制:提供了常用的过程管理图和过程性能图。 • 试验设计:包括完全析因设计、不完全析因设计和 D− 优化设计。 - 172 - 第十章 soft • 统计图:包括箱形图、经验累加分布函数图、误差条图、函数交互等值线图、交互画 线、交互点标注、散点矩阵图、散点图、添加最小二乘拟合线、正态概率图、帕累托 图、q-q图、回归个案次序图、参考多项式曲线、添加参考线、交互插值等值线图和威布 尔图。 矩阵函数 det(A) rank(A) inv(A) pinv(A) trace(A) 行列式 秩 逆 伪逆 迹 值域、零空间和子空间的夹角 正交基,它的列数等于 A 的秩 零空间的正交基 夹角 矩阵的列划分的子空间的夹角 orth(A) null(A) subspace(x,y) subspace(A,B) A 的向量空间就是由 A 的列划分的线性空间,这个空间的维数是 r,如果 r = n,则列线 性无关。 A 的零空间是由满足条件 AX = 0 的所有向量 X 组成的线性子空间。 线性 系 统的 求 解和 LU 因 式分 解 A\b [L, U ] = lu(A) [L, U, P ] = lu(A) 求解线性系统 求上三角矩阵 U 和交换下三角矩阵 L。 满足 LU = P A。 M AT LAB 依据系数矩阵的不同而相应地使用不同的方法求解纯属系统。如果可能,先分 析矩阵的结构。如果系数矩阵是对称且正定的,则使用 Cholesky 分解。 如果没有找到可以替代的方法,则使用高斯消元法和部分主元法。主要是对矩阵进行 LU 因式分解。这种方法就是令 A = LU , L 是一个带有单位对角线的下三角矩阵, U 是一个上三 角矩阵。 L 通常是一个改变序列的下三角矩阵,即有时进行互换,可能显得结构不完整。交换矩阵 P 是一个单位矩阵,按照交换的顺序来交换列向量。交换矩阵的逆等于它本身的转置。 解 线 性方 程 组 AX = b 的方 法 x = bicg(A, b, tol , maxit, M ) bicg(A, b, · · · , M 1, M 2, x0) [x, f lag, relres, iter, resvect] = bicg(· · · ) bicgstab(· · · ) cgs(· · · ) gmres(A, b, restart) pcg(· · · ) qmr(· · · ) 用双共轭梯度法解方程组 M 是预处理因子 M = M1 ∗ M2 x0 是初始向量 求 x 中的问题解 收敛信息放在 f lag 中 稳定双共轭梯度法 复共轭梯度平方法 广义最小残量法 预处理共轭梯度法 准最小残量法 - 173 - 10.4 matlab 行梯形矩阵 rref(A) rref(A,tol) rrefmovie(A) 阶梯矩阵 同时给出求解过程 通常使用的精度是 tol = max(size(A)) ∗ eps ∗ norm(A, inf )。 Cholesky 因 式 分 解 chol(A) [G, err]=chol(A) R1=cholupdate(R,x) R1=cholupdate(R,x,’-’) A的Cholesky因子 如果A不是一个正定矩阵 将 err 设为非零值 R = chol(A) A + xx0 的上三角cholesky因子 A − xx0 的上三角cholesky因子 对称正定矩阵: A = A0 ;对于每个 x 6= 0 都有 x0 Ax > 0,则存在一个上三角矩阵 G,它的 对角线元素都是正数,且满足 G0 G = A。 比较LU和Cholesky: flops(0),lu(A); flops,flops(0),chol(A); flops QR 因 式 分 解 [Q, R] = qr(A) [Q, R, P ] = qr(A) [Q, R] = qr(A, 0) [Q1, R1] = qrdelete(Q, R, j) [Q1, R1] = qrinsert(Q, R, b, j) AP = QR R 的对角线元素按大小降序排列 去掉A中第j列后形成的 矩阵的QR因式分解 在第j列前插入列向量b 假如 A 是 n × n矩阵,那么可以分解为:A = QR。其中 Q 是一个正交矩阵, R 是一个大 小和 A 相同的上三角矩阵。 QR因式分解能用来解超定方程组,即方程的个数比未知变量的个数多,还能用来求特征值 和特征向量。 Givens 和 Jacobi 旋 转 planerot(x) 求去掉有两个元素的向量X中第1个元素的 2 × 2 矩阵的Givens 旋转 [G,y ]=planerot(x) y = Gx rjr(A) Jacobi 旋转,旋转的角度和平面都是随机数,保存有特征向量、奇异值和对称性 向量范数 norm(x) 欧几里得范数 kxk2 = qX - 174 - |xk |2 第十章 soft norm(x,inf ) ∞− 范数 kxk = max(abs(x)) norm(x,1) 1− 范数 X kxk1 = norm(x,p) p− 范数 k |xk | r X kxk1 = k |xk |p norm(x,-inf ) 求向量X的元素的绝对值的最小值 向量的范数是一个标量,用来衡量向量的长度。 矩 阵 范数 用向量的范数来定义方阵的 p− 范数: kAXkp kAkp = sup X6=0 kXkp norm(A) 欧几里德范数,等于矩阵的最大奇异值 norm(A,1) 列范数,等于A的列向量的1-范数的最大值 norm(A,2) 欧几里德范数 norm(A,inf ) 行范数,等于A的行向量的1-范数的最大值 norm(A,’fro’) Frobenius范数 normest(A) 欧几里德范数的估计值,误差小于 106 normest(A,tol) 欧几里德范数的估计值,误差小于tol Frobenius范数: kAkF = rX X i j |aij |2 条 件 数 令 Ax = b表示线性方程组。方程组的条件数是一个大于或者等于1的实数,用来衡 量关于数据中的扰动,也就是A和(或)b,对解 x 的灵敏度。一个差条件的方程组的条件很 大。 条件数的定义: ° ° cond(A) = kAk °A−1 ° 欧几里德范数的条件数就是A的最大奇异数与最小奇异数的商。 cond(A) 欧几里德范数的条件数 cond(A,p) p范数的条件数 condest(A) A条件数的1范数中的下界估计值 [c,v]=condest(A) A条件数的1范数中的下界估计值,同时还计算向量 v: kAk kvk kAvk = c [c,v]=condest(A,tr) tr = 1 则显示计算每一步;如果 tr = −1,则给出商 c/rcond(A)。 - 175 - 10.4 matlab rcond(A) 求矩阵定义的方程组的敏感度的另一个估计值。对于差条件矩阵来说,给出一个接 近于零的数;对于好条件矩阵则给出一个接近于1的数。 例 10.1 求 Jilbert 矩阵的条件数bad = cond(hilb(5)) 表明在最坏情况下右边或系数矩阵的一个扰动和数 bad 相乘以后,可能会丢失五位小数。 最 小 二 乘 解 对于 Ax = b,如果 m > n ,即方程个数多于未知数,则称为超定方程组。通 常这些方程组是矛盾的,没有精确解。 关键是要找到一个向量 X ,使它对 m 个方程的总误差最小。 最小二乘法: e= m X (bi − i=1 n X aij xj )2 = kb − Axk22 j=1 A\b 最小二乘解 spaugment(A, c) 生成一个对称的希疏矩阵 T = [c ∗ IA; A0 0]。 nnls(A, b) 求非负最小二乘解 lscov(A, b, v) 已知协方差 V 情况下的最小二乘解 泊 松 分布 Poisson Distribution p(x) = λx −λx e , x! 例 10.2 (Poisson Distribution Curve) 数与概率分布函数曲线。 x = 0, 1, · · · 绘制λ = 1, 2, 5, 10 时 P oisson 分布的概率密度函 正 态 分布 normal distribution p(x) = √ (x−µ)2 1 e− σ2 2πσ 绘制 µ = 0, 1, 2,σ 2 = 1, 2, 3 时 N ormal 分布的概 例 10.3 (Normal Distribution Curve) 率密度函数与分布函数曲线。 伽 马 分布 Gamma Distribution ( pΓ (x) = λa xa−1 Γ(a) Z ∞ Γ(a) = 0 x>0 x<0 xa−1 e−x dx 0 源 代 码 10.1 分布函数:泊松分布 x =[0:15]’; y1=[ ]; y2=[ ]; lambda=[1,2,5,10]; for i=1:length(lambda) 2 y1=[y1,poisspdf(x,lambda(i))]; 3 y2=[y2,poisscdf(x,lambda(i))]; 4 end plot(x,y1), figure ; plot(x,y2) 1 - 176 - 第十章 soft 源 代 码 10.2 1 2 3 4 5 分布函数:正态分布 x=[−15:.05:15]’; y1=[ ]; y2=[ ]; mu=[0,1,2]; sig =[1,2,3]; for i=1:length(mu) y1=[y1,normpdf(x,mu(i),sig(i)) ]; y2=[y2,normcdf(x,mu(i),sig(i)) ]; end plot(x,y1), figure ; plot(x,y2) Γ(a) = aΓ(a − 1) Γ(1) = 1 1 Γ( ) = π 2 伽马函数的值可通过 gamma() 函数求得。 卡方 分布chi distribution ( p(x) = T 分布 k x 1 x 2 −1 e− 2 k 2 Γ( 2 ) k 2 0 x>0 x<0 · ¸ k+1 2 − 2 Γ( k+1 ) x p(x) = √ 2 k 1 + k kπΓ( 2 ) F 分布 ( p(x) = p q p p+q Γ( p+q ) −1 2 2 2 2 (p + qx)− 2 Γ( p2 )Γ( q2 ) p q x 0 Rayleigh 分 布 ( p(x) = 2 x x − 2b 2 b2 e 0 x>0 x<0 x>0 x<0 概率问题的求解 例 10.4 (条件概率) 已知两维随机变量 ε, η 联合概率密度求条件概率。 ½ p(x, y) = x2 + 31 xy 0 6 x 6 1, 0 6 y 6 2 0 else 求: P (ε < 1/2|η < 1/2) 源 代 码 10.3 1 2 3 4 5 Gamma Distribution Curve x =[−0.5:.02:15]’; y1=[]; y2=[]; a=[0,−1,1]; lambda=[0.1,1,1]; for i=1:length(a) y1=[y1,gampdf(x,a(i),lambda(i))]; y2=[y2,gamcdf(x,a(i),lambda(i))]; end plot(x,y1), figure ; plot(x,y2) - 177 - 10.4 matlab 源 代 码 10.4 CHI Distribution Curve x=[−eps:−0.02:−0.05,0:0.02:2]; x=sort(x’); k =[1,2,3,4,5]; y1=[]; 2 y2=[]; 1 3 for i=1:length(k) 5 y1=[y1,chi2pdf(x,k(i)) ]; 6 y2=[y2,chi2cdf(x,k(i )) ]; 7 end plot(x,y1), figure ; plot(x,y2) 4 源 代 码 10.5 1 T Distribution Curve x =[−5:0.05:5]’; k =[1,2,3,4,5]; y1=[]; y2=[]; 2 for i=1:length(k) 4 y1=[y1,tpdf(x,k(i)) ]; 5 y2=[y2,tcdf(x,k(i )) ]; 6 end plot(x,y1), figure ; plot(x,y2) 3 源 代 码 10.6 F Distribution Curve x=[−eps:−0.02:−0.05,0:0.02:2]; =sort(x’); 2 p =[1,2,3,4,5]’; 3 q =[2,3,4,5,6]’; y1=[]; y2=[]; 1 4 for i=1:length(p) 6 y1=[y1,fpdf(x,p(i) ,q(i )) ]; 7 y2=[y2,fcdf(x,p(i) ,q(i )) ]; 8 end plot(x,y1), figure ; plot(x,y2) 5 源 代 码 10.7 1 Rayleigh Distribution Curve x=[−eps:−0.02:−0.05,0:0.02:2]; x=sort(x’); 2 3 b =[.2,1,2,3,5]’; y1=[]; y2=[]; 4 for i=1:length(b) 6 y1=[y1,raylpdf(x,b(i)) ]; 7 y2=[y2,raylcdf(x,b(i)) ]; 8 end 5 9 10 plot(x,y1), figure ; plot(x,y2) - 178 - 第十章 soft 例 10.5 (区间概率) 已知随机变量 X ∼ N (1, 2),求 X 落入区间 (5, 7) 的概率。 例 10.6 (随机数生成:Rayleigh) 令 b = 1,生成 30000 × 1 个 Rayleigh 分布的随机数, 并用直方图检验生成数据的概率分布情况。 源 代 码 10.10 b=1; p=raylrnd(1,30000,1); x1=0:1:6; x2=0:.1:4; figure (1) ; hist (p) figure (2) ; hist (p,x2) yy=hist(p,x2); yy=yy/30000; figure (3) ; bar(x2,yy),y=raylpdf(x2,1); line (x2,y) 例 10.7 (求数字特征) 用积分法求伽马分布的均值与方差。 例 10.8 (数字特征:样本数) 生成一组 30000 个正态分布随机数,使其均值为 0.5,标准 差为 1.5,分析数据实际的均值、方差和标准差,如果减小随机变量个数,会有什么结果? 例 10.9 (矩) 求随机数的各阶原点矩和中心矩 例 10.10 (联合分布密度图) 素为零,绘制新图。 绘制二维联合分布正态分布图,如果协方差矩阵非对角线元 置信度估计 例 10.11 (置信度估计) 生成服从伽马分布,参数为 a = 1.5, λ = 3 的 30000 个伪随机 数,用不同的置信度估计:90%, 95%, 98%。 例 10.12 线性回归方程 Y = X1 − 1.2X2 + 2.3X3 + 3.4X4 + 5X5 ,生成 120 组随机输入值 Xi ,计算输出向量 Yi 。以这些信息为已知,由最小二乘得出待定系数的估计值,并得出 95% 置信求解。叠加方差为 0.5 的白噪声,画出误差差图。 例 10.13 (非线性函数最小二乘拟合) 用参数估计的方法求解最小二乘拟合问题,并得出 95% 的置信度的置信区间,并在实测信号的基础上叠加均匀分布的噪声信号再进行参数与区间 估计。原函数为 y(x) = a1 e−a2 x + a3 e−a4 x sin(a5 x)。 源 代 码 10.8 1 解条件概率 syms x y; f=xˆ2+x∗y/3; p=int(int(f,x,0,1/2),y,0,1/2) - 179 - 10.4 matlab 源 代 码 10.9 1 2 3 p7=normcdf(7,1,2); p5=normcdf(5,1,2); p=p7−p5 源 代 码 10.11 1 解区间概率 积分法求均值与方差 syms x; syms a lambda positive 2 3 p=(lambdaˆa∗xˆ(a−1)/gamma(a))∗exp(−lambda∗x); 4 m=int(x∗p,x,0,inf) s1=int((x−mu)ˆ2∗p,x,0,inf) 6 s2=simple(int((x−1/lambda∗a)ˆ2∗p,x,0,inf)) 5 源 代 码 10.12 1 数字特征:变化的样本容量 p=normrnd(0.5,1.5,10000,1); [mean(p) var(p) std(p)] 2 3 p=normrnd(0.5,1.5,100,1); [mean(p) var(p) std(p)] 源 代 码 10.13 1 求矩:随机抽样值与理论值 A=[]; B=[]; 2 3 p=normrnd(0.5,1.5,100000,1); 4 n=1:5; for r=n; 6 A=[A,sum(p.ˆr)/length(p)]; 7 B=[B,moment(p,r)]; 8 end 5 9 10 A,B 11 syms x; A1=[];B1=[]; 13 p=(1/(sqrt(2∗pi)∗1.5))∗exp(−(x−0.5)ˆ2/(2∗1.5ˆ2)); 12 14 for i=1:5 16 A1=[A1,vpa(int(xˆi∗p,x,−inf,inf),12) ]; 17 B1=[B1,vpa(int((x−0.5)ˆi∗p,x,−inf,inf),12) ]; 18 end 15 19 20 A1,B1 - 180 - 第十章 soft 源 代 码 10.14 1 p=randn(30000,4); cov(p) 源 代 码 10.15 1 生成协方差矩阵 绘制二维正态分布图 mu1=[−1,2]; sig1=[1 1;1 3]; 2 3 [X,Y]=meshgrid(−3:0.1:1,−2:0.1:4); xy=[X(:) Y(:)]; 4 5 p=mvnpdf(xy,mu1,sig1); P=reshape(p,size(X)); surf(X,Y,P) 6 figure (2) ; sig2=diag(diag(sig1)); p=mvnpdf(xy,mu1,sig2); 8 P=reshape(p,size(X)); surf(X,Y,P) 7 9 10 figure (3) ; R=mvnrnd(mu1,sig1,2000); plot(R(:,1),R(:,2),’o’) 11 12 figure (4) ; R=mvnrnd(mu1,sig2,2000); plot(R(:,1),R(:,2),’o’) 源 代 码 10.16 p=gamrnd(1.5,3,30000,1); Pv=[0.9,0.95,0.98]; 2 num=[30,300,3000,30000,300000]; A=[]; B=[]; 1 3 for i=1:length(Pv) 5 [a,b]=gamfit(p,Pv(i)); 6 A=[A;Pv(i),a(1),b(:,1) ’, a(2),b (:,2) ’]; 7 end 4 8 9 10 11 12 13 for i=1:length(num) p=gamrnd(1.5,3,num(i),1); [a,b]=gamfit(p,0.95); B=[B;num(i),a(1),b(:,1) ’, a(2),b (:,2) ’]; end 14 15 A,B - 181 - 置信度 10.5 SAS 源 代 码 10.17 1 最小二乘估计 a=[1 −1.2 2.3 3.4 5]’; X=randn(120,5); Y=X∗a; 2 3 hat a=inv(X’∗X)∗X’∗Y 4 5 [hat a1,aci]=regress(Y,X,0.05) 6 7 yhat=Y+sqrt(0.5)∗randn(120,1); 8 9 [a, aint]=regress(yhat,X,0.05) 10 11 errorbar (1:5, a, aint (:,1) −a,aint (:,2) −a) 源 代 码 10.18 非线性最小二乘拟合 f=inline( ’a(1)∗exp(−a(2)∗x)+a(3)∗exp(−a(4)∗x).∗sin(a(5)∗x)’,’a’,’x’); 2 x=0:0.1:10; y=f ([0.12,0.213,0.54,0.17,1.23], x); 1 3 4 [a,r , j]= nlinfit (x,y, f ,[1;1;1;1;1]) ; a 5 6 ci=nlparci(a,r , j ) 7 y1=y+0.02∗rand(size(x)); [a1,r1,j1]= nlinfit (x,y, f ,[1;1;1;1;1]) ; a1 9 ci1=nlparci(a1,r1, j1) errorbar (1:5, a1, ci1 (:,1) −a1,ci1 (:,2) −a1) 8 10.5 SAS 来自[25]、[26]。统 统计 图 展示各种与数据相关联的图形是统计中呈现数据的重要方法,当数 据经过审核、筛选、排序等预处理后,可以把它做成统计图。统计图一般是用点、线、面或立 体图像鲜明地表达数量或变化动态。常用的统计图有线图、直方图、条形图和统计地图等。一 个好的统计图能够把数据在图中清楚、准确、有效地表达出来。统计软件 SAS 可以帮助我们把 存贮在 SAS 数据集中的数据以图形的方式形象直观地显示出来。常 常用 数 据 类 型 及 适 用 的 统 计 图 定类数据-条形图 表 10-3 数据类型 品质数据定类数据 定序数据 数值型数据分组数据 未分组数据 时间序列数据 地域性数据 常用数据类型及适用的统计图 例 心血管病的死亡原因 碳氧血红蛋白的含量 食物中毒患者的潜伏期 110名男大学生身高 10年某小学的麻疹曾患率(%) 某省痢疾流行时的患者分布 - 182 - 统计图 条形图;饼图 累积分布图 折线图 方图;茎叶图;箱线图;散点图 间隔图形 统计地图 第十章 soft 条形图是用宽度相同的条形的高度或长短来表示数据变动的图形。一般用条形图的高度来 表示各类别数据的频数。它常用于两个或多个组某指标大小的比较。 条形图的类型一般有三种: • 简单条形图,用于表现单个指标的大小; • 分组条形图,用于表现两个或多个指标,比如同时进行男、女性血红细胞和血红蛋白值的 比较; • 分段条形图,用于表现每个直条中某个因素各水平的构成情况,比如男女两种性别的某指 标构成的比较。 未 分 组 数 据 : 直 方 图 , 茎 叶 图 , 箱 线 图 , 散 点 图 直方图,未分组的原始数据,数值型数 据表现为数字,在整理时通常进行数据分组。分组是根据统计研究的需要,将数据按照某种标 准分成不同的组别。直方图是用矩形的宽度和高度来表示频数分布的图形。用横轴表示数据分 组,纵轴示频数或频率。 对于未分组的原始数据,我们可以用茎叶图来显示其分布的特征。茎 叶图由“茎”和“叶”两部分构成,其图形是由数字组成的。通过茎叶图,可以看出数据的分 布形状及数据的离散状况,比如分布是否对称,数据是否集中,是否有极端值等。 箱线图是由 一组数据的5个特征值绘制而成的,它由一个箱子和两条线段组成。5个特征值依次是最大值、 上四分位数、中位数、下四分位数和最小值。通过箱线图,可以反映出数据分布的特征。箱线 图一般有单批数据箱线图和多批数据箱线图两种。对于多批数据,我们可以将各批数据的箱线 图并列起来,从而进行分布特征的比较。 未分组数据-散点图: 表示两种事物变量的相关性和 趋势。 时间序列数据-间隔图形: 当观测按日期或时间排列时,数据就构成时间序列数据。我 们一般采用“T imeplot”过程对一个或几个变量绘制时间间隔的散点图。间隔图形的类型一般 有单个变量的间隔图形和多个变量的间隔图形两种。 状 态 空 间 模 型 PROC STATESPACE 适用于预测几个相关的有动态相互影响的时间序 列,并考虑到整个变量集之内的自相关。 其前提是假定时间序列为联合平稳,非平稳序列需要通过初始变换,通常是差分变换,成 为平稳序列。 定义 10.1 (状态空间模型) 通过辅助变量表示一个多元时间序列,这些辅助变量的某些 部分或许不能直接观测到,观测的时间序列被表示成状态变量的线性组合。状态空间模型也称 为多元时间序列的马尔可夫表示,或典型表示。它是由 Akaike(1974) 概括的。 定义 10.2 (状态向量) 状态空间模型中的辅助变量,它概括了所有的来自与时间序列将 来值的预测值相关的时间序列的当前及过去值的信息。 定义 10.3 (状态转移方程) Zt+1 = F Zt + Get+1 • s × s 系数矩阵 F 被称为转移矩阵,它决定了模型的动态性质 源 代 码 10.19 SAS Code:简单条形图 PROC GCHART; 2 VBAR X/SUMVAR=Y; 3 PATTERN V=X5 C=BLUE; 4 RUN; 1 - 183 - 10.5 SAS 源 代 码 10.20 SAS Code:分组条形图 PROC GCHART; 2 VBAR GENDER/GROUP=CASE SUMVAR=RATIO PATTERNID=MIDPOINT; 3 PATTERN V=X5 C=BLUE; 4 RUN; 1 源 代 码 10.21 1 2 3 4 5 SAS Code:分段条形图 PROC GCHART; WHERE GENDER IN (’M’, ’F’); VBAR CASE/SUBGROUP=GENDER SUMVAR=RATIO ; PATTERN V=X5 C=BLUE; RUN; 源 代 码 10.22 SAS Code:直方图 data beishu; input beishu@@; cards; 100 200 400 400 400 400 800 1600 2 1600 1600 3200 ; proc capability ; histogram beishu/ cfill =gray; run; 1 源 代 码 10.23 1 2 3 4 5 data beishu; input beishu@@; cards; 100 200 400 400 400 400 800 1600 1600 1600 3200 ; proc univariate plot ; var beishu; run; 源 代 码 10.24 1 2 3 4 5 6 7 8 9 SAS Code:茎叶图 SAS Code:箱线图 data beishu; input type beishu@@; 1 200 1 400 2 400 2 400 1 340 2 350 1 345 2 350 1 380 2 390 2 400 1 385 ; proc boxplot; plot beishu∗type; run; - 184 - 第十章 soft 源 代 码 10.25 1 2 3 4 5 6 7 8 9 data beishu; input type beishu@@; 1 200 1 400 2 400 2 400 1 340 2 350 1 345 2 350 1 380 2 390 2 400 1 385 ; proc gplot; plot beishu∗type; run; 源 代 码 10.26 1 2 3 4 5 SAS Code:散点图 SAS Code:多变量时序间隔图 data cancer; input year us world@@; cards; 1940 12.6 31.2 1950 10.0 30.6 1960 14.2 46.2 1965 15.0 55.0 1970 10.2 53.6 1972 13.7 62.9 1973 13.0 63.3 1974 11.5 64.3 ; proc sort ; by year; proc timeplot; plot us world/overlay; id year; run; • s × r 系数矩阵 G 称为输入矩阵,它决定了转移方程的方差结构, • 输入向量 et 是一个独立的 r 维正态分布随机向量,或称新息向量,震动向量 测量方程 Xt = [Ir 0]Zt Xt 是一个 r 维观测向量,它是经过差分(如果指定了差分)并减去样本均值所组成的。 Akaike(1976) 的建模策略,使用典型相关分析作为建模标识。 产生 X 和 Y 序列: - 185 - 10.5 SAS 源 代 码 10.27 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 产生X 和Y 序列 DATA LI.XYIN; X=10;Y=40; X1=0;Y1=0; A1=0;B1=0; ISEED=123; DO T=−100 TO 200; A=RANNOR(ISEED); B=RANNOR(ISEED); DX=0.5∗X1+0.3∗Y1+A−0.2∗A1−0.1∗B1; DY=0.5∗Y1+0.3∗X1+B; X=X+DX+0.5; Y=Y+DY+0.5; IF T>=0 THEN OUTPUT; X1=DX;Y1=DY; A1=A;B1=B; END; KEEP T X Y; RUN; PROC GPLOT DATA=XYIN; SYMBOL I=JOIN; PLOT Y∗T X∗T /OVERLAY HAXIS= 0 TO 200 BY 10 ; RUN; 对序列进行一阶差分并向前预测 10 步。序列建模前先减去均值,产生预测值后再加回来。 可指定 N OCEN T ER 选项不减去样本均值。建模方式是: xt = (1 − B)Xt − x̄t yt = (1 − B)Yt − ȳt 根据 AIC 定阶。 - 186 - 第十章 soft 源 代 码 10.28 SAS:差分、预测、作图、修正 PROC STATESPACE DATA=XYIN OUT=OUT LEAD=10; 2 VAR X(1) Y(1); 3 ID T; 4 RUN; 1 5 PROC PRINT DATA=OUT; 7 ID T; 8 WHERE T > 190; 9 RUN; 6 10 11 12 13 14 15 16 17 PROC GPLOT DATA=OUT; SYMBOL1 V=PLUS I=JOIN; SYMBOL2 V=STAR I=NONE; PLOT FOR1∗T=1 FOR2∗T=1 X∗T=2 Y∗T=2 /OVERLAY HREF=200.5; RUN; 18 19 20 21 22 23 24 PROC STATESPACE DATA=XYIN OUT=OUT LEAD=10 OUTAR=B; VAR X(1) Y(1); ID T; FORM X 2 Y 1; RESTRICT F(2,3)=0; RUN; 除差分外,一种对时间趋势去势的方法是对时间的回归。如果时间序列中具有决定性的线 性趋势,序列对时间的回归残差应是平稳的。 - 187 - 10.5 SAS 源 代 码 10.29 SAS:时间回归去势 PROC REG DATA=LI.XYIN; 2 DETREDNING:MODEL X Y =T; 3 OUTPUT OUT=DETREND R=RX RY; 4 RUN; 1 5 PROC STATESPACE DATA=DETREND OUT=DETREND LEAD=10 PRINTOUT=LONG; 7 VAR RX RY; 8 ID T; 9 RUN; 6 取 子 数 据 集 用SET 语 句 引 入 全 数 据 集 ,IF 和WHERE 语 句 指 定 取 子 集 的 条 件,DROP、KEEP 选项或语句取变量的子集,firstobs= 和obs= 选项选择子集。时 时间序 列 横 断 面 形 式 存 储 数 据 所有横断面的序列都存入一个ID变量,另一个横断面ID变量用来区 别不同序列的观测。观测按横断面ID变量排序,内部按时间排序。指 指 定 时 间 间 隔 使用诸如 Y EAR, QT R, M ON T H, DAY 之类指定时间间隔。 • Y EAR2 表示时间间隔为两年 • Y EAR.7 表示从七月开始的财政年度 纵 向绘 时 间刻 度 使用 T IM EP LOT 过程。 - 188 - 第十章 soft A 到B 的转换 源 代 码 10.30 A 到B 的转换1 data a; input id time sbps @@; datalines; 1 1 123 1 2 126 1 3 128 2 2 1 112 2 2 110 2 3 115 ; run; 1 3 proc transpose data=a out=b(drop= NAME ) prefix=sbps; by id; var 5 sbps; run; 4 源 代 码 10.31 1 2 3 4 5 6 7 8 9 10 11 A 到B 的转换2 data b; set a; by id ; retain sbp1−sbp3; array sbp [3]; if first . id then i=1; sbp[i]=sbps; i+1; if last . id then output; drop sbps time i ; run; 12 13 proc print ; run; - 189 - 10.6 宏 1 2 3 4 5 6 7 8 9 源 代 码 10.32 A 到B 的转换3 源 代 码 10.33 A 到B 的转换4 data b; retain id ; array u[∗] sbp1−sbp3; do i=1 to dim(u); set a ; u[ i]=sbps; end; drop sbps time i ; run; 10 11 proc print ; run; data one; label x1=’601’ x2=’602’ x3=’603’; input date x1−x3 @@; 2 cards; 2001 2.1 1.2 3.5 2002 2.2 1.3 3.6 2003 2.3 1.4 3.7 ; run; 1 3 proc transpose out=two; by date; var x1−x3; proc sort; by Name ; 5 proc print ; run; data three (drop= name ); set two; rename 6 label =code col1=pro; proc print; run; 4 10.6 宏 - 190 - 第十章 soft 源 代 码 10.34 1 2 3 4 5 6 %PUT AUTOMATIC ; %PUT &SYSDAY; %PUT THIS VERSION IS &SYSVER; %PUT AUTOMATIC ; %PUT USER ; %PUT ALL ; 源 代 码 10.35 1 2 3 4 5 6 7 8 9 SAS:显示自动宏变量的值 SAS:脚注提供报告日期 OPTIONS SYMBOLGEN; %LET A=%SYSFUNC(TODAY(),WORDDATE.); PROC FREQ DATA=LI.RND; TABLES P; TITLE ”Report Produce on %SYSFUNC(LEFT(%QSYSFUNC(TODAY(), WORDDATE.)))”; FOOTNOTE1 ”Created &systime &sysday,&sysdate9”; FOOTNOTE2 ”On the &sysscp system using Release &sysver”; FOOTNOTE3 ”&A”; RUN; 如 何 在 同 一 页 上 绘 制 多 个 散 点 图 proc greplay ; proc iml; overlay 本 记 录 与 上 次 记 录 的 和 与累加和 源 代 码 10.36 本记录与上次记录的和 data test ; 2 input a b; 3 cards; 4 2 1 2 1 2 1 2 1 2 3 2 3 2 3 ; run; 1 5 6 7 8 9 10 11 12 13 14 15 data result ; set test ; if n >1 then do; n= n −1; /∗find last b∗/ set test (keep=b rename=(b=pre)) point=n; b=b+pre; drop pre; end; run; - 191 - 10.6 宏 [style=numbers,caption=累加和] 源 代 码 10.37 data result ; set test ; retain pre; b=sum(b,pre); pre=b; run; 把 data set里 observation的 数目 保 存在 一 个变 量 中 源 代 码 10.38 data raw; input x; cards; 1 2 3 ; data set raw nobs=n; call symput(’z’,n); stop; run; %put z=&z; null ; data null ; if 0 then set raw nobs=obs num; /∗obs num is a variable you want to define∗/ put ”obs num=” obs num; run; ods listing close ; ods html close ; proc datasets ; contents data=raw out=count(keep=nobs) SHORT ; quit; ods listing; proc print data=count;run; proc sql ; create table b as select count(∗) as obs from raw; quit; - 192 - 第十一章 学习摘要 第十一章 学习摘要 11.1 趋势稳定过程与单位根过程 来自[? ] 定义 11.1 (TSP) 趋势稳定指对某些数据,可以通过退化趋势而获得稳定,即对 yt = α + βt + ut 其中 ut ∼ I(0)。 定义 11.2 (DSP) 差分稳定指 ∆yt = α + ut 其中 ut ∼ I(0)。 从图形上看,T SP 数据显然是围绕时间趋势 βt 波动且随着时间或增或减。相比较而 言,DSP 数据图形不如 T SP 显著和有规律。 为检验数据是 T SP 还是 DSP ,设定 yt = β0 + β1 t + ut , ut = ρut−1 + et , et ∼ iid (11-1) 当 ρ < 1 时,数据生成过程是 T SP 。另一方面: yt − yt−1 = β1 + ut − ut−1 有 yt = β0 + β1 t + ut = β0 + β1 t + ρut−1 + et = β0 + β1 t + ρ[yt−1 − β0 − β1 (t − 1)] + et 可以将原式约简为 yt = α + δt + ρyt−1 + et (11-2) 其中: α = β0 − ρ(β0 − β1 ) δ = β1 (1 − ρ) 若 ρ = 1,则 δ = 0。这样,可将原假设写为: H0 ρ = 1, δ = 0 (11-3) 接受原假设意味着数据为 DSP :拒绝原假设则意味着数据为 T SP 。这个方法要求原式的误差 结构为 AR(1) 过程。但许多经济变量的时间序列数据并不满足这一条件。 11.2 结构突变的趋势稳定 对 yt 是趋势稳定还是结构变化的趋势稳定可表述为: yt = αt + δt + et αt = αt−1 + εt εt ∼ iid H0 σε2 = 0 由于 αt = α (常数)与 σε2 等价,接受原假设意味着 yt 是趋势稳定,拒绝原假设意味着数据生成 过程是结构变化的趋势稳定。 - 193 - 11.3 外生性结构突变的单位根及其检验 Kwiatkowski, P hillips, Schmidt, Shin(1992)提出对原假设为结构突变的 H0 的检验统计量 LM 。 T P LM = St2 /σ̂ε2 t=1 (11-4) t P St = ei t = 1, 2, · · · , T i=1 KP SS 检验的渐近临界值表可见[? ]的第 135页。Leybourne, M cCabe 1994 发现该检验势偏 低。 11.3 外生性结构突变的单位根及其检验 定义 11.3 (外生性结构突变点) 生性结构突变点。 先验设定外生结构突变点即结构突变点已知时称其为外 假定发生结构突变的时点已知为tB : ½ Dt = 1 t > tB 0 else 若单位根过程具有截距突变: yt = µ0 + yt−1 + µ1 Dt + et et ∼ I(0) (11-5) 则称 yt 为具 具有 结 构 突 变 的 单 位 根 过 程 。 记确定性趋势为 DTt = µ0 + δt,则截距突变表示为 DTt = µ0 + δt + µ1 Dt ,对应的模型为 yt = µ0 + δt + µ1 Dt + et (11-6) 当 e(t) ∼ I(1) 时 , 称 yt 由 结 构 变 化 的 单 位 根 过 程 所 生 成 。 这 一 模 型 亦 称 为 崩 溃 模 型 CrashM odel。这是因为结构变化之后,yt 的均值不再返回结构变化之前的均值轨迹。 当突变发生在斜率(时间趋势系数)而截距不变,即 DTt = µ0 + δ0 t + δ1 t∗ ,当 t > tB 时,t∗ = t − tB ;当 t < tB 时,t∗ = 0。其对应的模型为 yt = µ0 + δ0 t + δ1 t∗ + et (11-7) 由于斜率反映增长率,因此也称模型为变 变化 的 增 长 率 模 型 。 当截距和斜率同时具有结构变化,即 DTt = µ0 + µDt + δ0 t + δ1 Dt t∗ + et ,对应的模型为: yt = µ0 + µ1 Dt + δ0 t + δ1 Dt t∗ + et (11-8) 对于以上三个模型,当 r(t) ∼ I(1) 时,yt 具有结构变化的单位根;而 e(t) ∼ I(0) 时,yt 是 为结构变化的趋势稳定。对这三个模型其原假设为 H0 : et ∼ I(1),备择假设为 H1 : et ∼ I(0)。 这三个模型也称外 外 层 追 加 模 型 additiveoutlier,因为结构变化之后的数据与变化之前相比较, 有一个垂直横轴的位移,故这些数据就像是原始数据的外层,从而将模型称为外层追加模型。 - 194 - 附录A 图表 附录 A - 195 - 图表 §A.1 自相关和偏自相关函数表 §A.1 自相关和偏自相关函数表 - 196 - 附录A 图表 §A.2 ADF 检验表 - 197 - §A.3 相关系数临界值检验表 §A.3 相关系数临界值检验表 - 198 - 附录A 图表 ൟ ARIMA(1,1,1) 㞾Ⳍ݇ߑ᭄⡍ᕕ أ㞾Ⳍ݇ߑ᭄⡍ᕕ 㓧᜶ഄ㒓ᗻ㹄ޣ ' xt = M1' xt-1 + ut + T1ut-1 1.0 1.0 0.5 0.5 0.0 0.0 -0.5 -0.5 -1.0 2 AR˄1˅ xt = M1 xt-1 + ut 4 6 8 10 12 14 㢹M1 > 0ˈᑇ⒥ഄᣛ᭄㹄ޣ 4 6 8 10 12 14 0.8 0.6 0.6 0.4 0.2 0.2 0.0 0.0 -0.2 -0.2 -0.4 -0.4 -0.6 -0.6 -0.8 -0.8 2 4 6 8 10 12 2 14 㢹M1 < 0ˈℷ䋳Ѹ᳓ഄᣛ᭄㹄ޣ 4 6 8 10 12 14 㢹M11 < 0ˈk=1 ᯊ᳝䋳ዄؐ✊ৢሒ 0.8 0.8 0.6 0.6 0.4 0.4 0.2 0.2 0.0 0.0 -0.2 -0.2 -0.4 -0.4 -0.6 -0.6 -0.8 -0.8 2 MA˄1˅ 2 㢹M11 > 0ˈk=1 ᯊ᳝ℷዄؐ✊ৢሒ 0.8 0.4 xt = ut + T1 ut-1 -1.0 4 6 8 10 12 14 㢹T1 > 0ˈk=1 ᯊ᳝ℷዄؐ✊ৢሒ 2 4 6 8 10 12 14 㢹T1 > 0ˈѸ᳓ᓣᣛ᭄㹄ޣ 0.8 0.6 0.8 0.4 0.6 0.2 0.4 0.2 0.0 -0.2 0.0 -0.4 -0.2 -0.6 -0.4 -0.8 -0.6 2 4 6 8 10 12 14 -0.8 2 4 6 8 10 12 14 㢹T1 < 0ˈk=1 ᯊ᳝䋳ዄؐ✊ৢሒ 㢹T1 < 0ˈ䋳ⱘᑇ⒥ᓣᣛ᭄㹄ޣ 0.8 0.6 0.8 0.4 0.6 0.2 0.4 0.0 0.2 -0.2 0.0 -0.4 -0.2 -0.6 -0.4 -0.6 -0.8 2 4 6 8 10 12 14 -0.8 2 AR˄2˅ xt = M1 xt-1 + M2 xt-2 + ut 4 6 8 10 12 14 k=1, 2 ᯊ᳝ϸϾዄؐ✊ৢሒ ᣛ᭄ℷᓺ㹄ޣ 0.8 0.8 0.6 0.6 0.4 0.4 0.2 0.2 0.0 0.0 -0.2 -0.2 -0.4 -0.4 -0.6 -0.6 -0.8 -0.8 2 4 6 8 10 12 ˄ϸϾ⡍ᕕḍЎᅲḍ˅ - 199 - 14 2 4 6 8 10 ˄M1 > 0ˈM2 > 0˅ 12 14 §A.3 相关系数临界值检验表 0.8 0.8 0.6 0.6 0.4 0.4 0.2 0.2 0.0 0.0 -0.2 -0.2 -0.4 -0.4 -0.6 -0.6 -0.8 -0.8 2 4 6 8 10 12 14 2 xt = ut + T1 ut-1+ T2 ut-2 0.8 0.8 0.6 0.6 0.4 0.4 0.0 -0.2 -0.2 -0.4 -0.4 4 6 8 10 12 14 ˄T1 >0ˈT2< 0˅ 2 4 6 8 10 12 14 8 10 12 14 ˄T1 >0ˈT2< 0˅ 0.8 0.8 0.6 0.6 0.4 0.4 0.2 0.2 0.0 0.0 -0.2 -0.2 -0.4 -0.4 -0.6 -0.6 -0.8 -0.8 2 4 6 8 10 12 2 14 4 6 ˄T1 > 0ˈT2 > 0˅ ˄T1 > 0ˈT2 > 0˅ k=1 ᳝ዄؐ✊ৢᣝᣛ᭄㹄ޣ k=1 ᳝ዄؐ✊ৢᣝᣛ᭄㹄ޣ 1.0 1.0 0.5 0.5 0.0 0.0 -0.5 -0.5 2 4 6 8 10 12 14 ˄M1 > 0ˈT1 > 0˅ 2 4 6 8 10 12 14 8 10 12 14 ˄M1 > 0ˈT1 > 0˅ 0.8 0.8 0.6 0.6 0.4 0.4 0.2 0.2 0.0 0.0 -0.2 -0.2 -0.4 -0.4 -0.6 -0.6 -0.8 -0.8 2 4 6 8 10 12 14 2 4 6 ˄M1 >0ˈT1< 0˅ ˄M1 >0ˈT1< 0˅ k=1 ᳝ዄؐ✊ৢᣝᣛ᭄ℷᓺ㹄ޣ k=1, 2 ᳝ϸϾዄؐ✊ৢᣝᣛ᭄㹄ޣ 0.8 0.8 0.6 0.6 0.4 0.4 0.2 0.2 0.0 0.0 -0.2 -0.2 -0.4 -0.4 -0.6 -0.6 -0.8 -0.8 2 ARMA˄1ˈ2˅ 14 -0.6 2 xt = M1 xt-1+ M2 xt-2+ ut + T1 ut-1 12 -0.8 -0.8 ARMA˄2ˈ1˅ 10 0.2 0.0 -0.6 xt = M1 xt-1 + ut + T1 ut-1 8 ᣛ᭄ℷᓺ㹄ޣ k=1, 2 ᳝ϸϾዄؐ✊ৢሒ 0.2 ARMA˄1ˈ1˅ 6 ˄M1 >0ˈM2< 0˅ ˄ϸϾ⡍ᕕḍЎ݅䕁ḍ˅ MA˄2˅ 4 4 6 8 10 12 14 2 4 6 8 10 12 14 ˄M1 >0ˈM2< 0ˈT1 > 0˅ ˄M1 >0ˈM2< 0ˈT1 > 0˅ k=1, 2 ᳝ϸϾዄؐ✊ৢᣝᣛ᭄㹄ޣ k=1 ᳝ዄؐ✊ৢᣝᣛ᭄ℷᓺ㹄ޣ xt = M1 xt-1+ ut + T1 ut-1+ T2 ut-2 - 200 - 附录A 图表 0.8 0.8 0.6 0.6 0.4 0.4 0.2 0.2 0.0 0.0 -0.2 -0.2 -0.4 -0.4 -0.6 -0.6 -0.8 -0.8 2 4 6 8 10 12 14 ˄M1 > 0ˈT1 >0ˈT2< 0˅ 4 6 8 10 12 14 12 14 ˄M1 > 0ˈT1 >0ˈT2< 0˅ 1.0 1.0 0.8 0.8 0.6 0.6 0.4 0.4 0.2 0.2 0.0 0.0 -0.2 -0.2 -0.4 -0.4 -0.6 -0.6 -0.8 -0.8 2 ARMA˄2ˈ2˅ 2 4 6 8 10 12 14 2 4 6 8 10 ˄M1 > 0ˈT1 > 0ˈT2 >0˅ ˄M1 > 0ˈT1 > 0ˈT2 > 0˅ k=1, 2 ᳝ϸϾዄؐ✊ৢᣝᣛ᭄ℷᓺ k=1, 2 ᳝ϸϾዄؐ✊ৢᣝᣛ᭄ℷᓺ xt=M1xt-1+M2xt-2+ ut +T1ut-1+T2ut-2 㹄ޣ 㹄ޣ 0.6 0.8 0.6 0.4 0.4 0.2 0.2 0.0 0.0 -0.2 -0.2 -0.4 -0.4 -0.6 -0.6 -0.8 2 4 6 8 10 12 14 ˄M1 >0ˈM2< 0ˈT1 >0ˈT2< 0˅ 0.8 2 4 6 8 10 12 14 ˄M1 >0ˈM2< 0ˈT1 >0ˈT2< 0˅ 0.8 0.6 0.4 0.4 0.2 0.0 0.0 -0.2 -0.4 -0.4 -0.6 -0.8 -0.8 2 4 6 8 10 12 14 ˄M1 >0ˈM2< 0ˈT1 > 0ˈT2 > 0˅ - 201 - 2 4 6 8 10 12 14 ˄M1 >0ˈM2< 0ˈT1 > 0ˈT2 > 0˅ §A.3 相关系数临界值检验表 ൟ 㒳䅵䞣 WU WU WD WD WE WU ḋᴀᆍ䞣 ! ! ! ! ! ! - 202 - 1 附录A 图表 D f 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 25 30 35 40 45 50 60 70 80 90 100 0.10 0.98769 0.90000 0.8054 0.7293 0.6694 0.6215 0.5822 0.5494 0.5214 0.4933 0.4762 0.4575 0.4409 0.4259 0.4124 0.4000 0.3887 0.3783 0.3687 0.3598 0.3233 0.2960 0.2746 0.2573 0.2428 0.2306 0.2108 0.1954 0.1829 0.1726 0.1638 0.05 0.99692 0.95000 0.8783 0.8114 0.7545 0.7067 0.6664 0.6319 0.6021 0.5760 0.5529 0.5324 0.5139 0.4973 0.4821 0.4683 0.4555 0.4438 0.4329 0.4227 0.3809 0.3494 0.3246 0.3044 0.2875 0.2732 0.2500 0.2319 0.2172 0.2050 0.1946 图 1-2 0.02 0.999507 0.98000 0.93433 0.8822 0.8329 0.7887 0.7498 0.7155 0.6851 0.6581 0.6339 0.6120 0.5923 0.5742 0.5577 0.5425 0.5285 0.5155 0.5034 0.4921 0.4451 0.4093 0.3810 0.3578 0.3384 0.3218 0.2948 0.2737 0.2565 0.2422 0.2301 相关系数临界值检验表 - 203 - 0.01 0.999877 0.99000 0.95873 0.91720 0.8745 0.8343 0.7977 0.7646 0.7348 0.7079 0.6835 0.6614 0.6411 0.6226 0.6055 0.5897 0.5751 0.5614 0.5487 0.5368 0.4869 0.4487 0.4182 0.3932 0.3721 0.3541 0.3248 0.3017 0.2830 0.2673 0.2540 0.001 0.9999988 0.99900 0.99116 0.97406 0.95074 0.92493 0.8982 0.8721 0.8471 0.8233 0.8010 0.7800 0.7603 0.7420 0.7246 0.7084 0.6932 0.6787 0.6652 0.6524 0.5974 0.5541 0.5189 0.4896 0.4648 0.4433 0.4078 0.3799 0.3568 0.3375 0.3211 附录 B 数学公式证明与推导 §B.1 自相关函数通解表达式的证明 对于 AR(p) 过程 xt = φ1 xt−1 + φ2 xt−2 + · · · + φp xt−p + ut (2-1) ρk = φ1 ρk−1 + φ2 ρk−2 + · · · + φp ρk−p (2-2) (1 − φ1 L − φ2 L2 − · · · − φp Lp )ρk = 0 (2-3) ρk = A1 Gk1 + A2 Gk2 + · · · + Ap Gkp (2-4) 它的自相关函数满足下式 上式可改写为 则(2-2)有通解 证明:采用数学归纳法证明。 1。 对 于 AR(1) 过 程 , 它 是 显 然 成 立 的 。 2。 对 于 AR(2) 过 程 , 有 (1 − G1 L)(1 − G2 L)ρk = 0 (2-5) (1 − G2 L)ρk = yk (2-6) yk = G1 yk−1 = Gk1 y0 (2-7) 令 根 据(2-5)有 y0 是 系 统 决 定 的初 始 值 。 代 入 (2-6)并 进 行 迭 代 ρk k = G2 (G2 ρk−2 + Gk−1 1 y0 + G1 y0 ) + · · · + G1 G2k−1 ) = Gk2 ρ0 + y0 (Gk1 + G2 Gk−1 1 (2-8) 当 (2-5)有 相同 解 时, 显 然(2-8)可以 写 成(2-2) 形 式 。 当 (2-5)有 相 异解 时 ,(2-8)可做 如 下变 换 rhok k k k 1 −G2 = G 2 ρ0 + y 0 G 1 G G1 −G2 = A1 Gk1 + A2 Gk2 3。 对 于 AR(ρ − 1) 过 程 : §B.2 密度函数估计的渐近无偏性与相合性证明 这是因为: ¶¾ ½ µ 1 x−X Efn (x) = E K h(n) h(n) ¶ Z +∞ µ x−t 1 K f (t)dt = h(n) −∞ h(n) ¶ Z +∞ µ 1 y = K f (x − y)dy(x − t = y) h(n) −∞ h(n) ¶ µ Z +∞ y =Z = K (Z) f (x − h(n)Z)dZ h(n) −∞ - 204 - (2-9) 附录B 数学公式证明与推导 Z |Z|>T0 K(Z)dZ 6 ε M 4 M = sup f (x) x Z T0 lim h→∞ −T0 Z T0 K(Z)dZ K(Z)f (x − hZ)dZ = f (x) −T0 |Efn (x) − (x)| ¯ ¯Z T0 Z T0 Z ¯ ¯ ¯ ¯ K(Z)f (x − h(n)Z)dZ − K(Z)f (x)dZ ¯ + 2 |Z|>T0 K(Z)dZ · M 6¯ −T0 −T0 ¯Z T0 ¯ Z T0 ¯ ¯ ε K(Z)f (x − h(n)Z)dZ − f (x) 6 ¯¯ K(Z)dZ ¯¯ + 2 −T0 −T0 ε → (n → +∞) 2 lim Efn (x) = f (x) n→∞ " ¶ µ µ ¶¶2 # µ 1 x − X 1 x − X EK 2 V ar(fn (x)) = · 2 − EK n h (n) h(n) h(n) · µ ¶¸ Z +∞ 1 2 x−X lim E K = f (x) K 2 (x)dx n→∞ h(n) h(n) −∞ lim E(fn (x) − f (x))2 = lim V ar(fn (x)) + lim (Efn − f (x))2 = 0 n→∞ n→∞ n→∞ P fn (x) − → f (x)(n → ∞) - 205 - 附录 C §C.1 词汇表 A - 206 - 附录C 词汇表 §C.2 B dominant root 强根。特征方程中绝对值较大的根。 - 207 - §C.3 C §C.3 C compact curse of dimensionality 紧 维数灾 - 208 - 附录C 词汇表 §C.4 D dynamic programming deterministic decision process 动态规划 确定性决策过程 - 209 - §C.5 E §C.5 E exact differential equation 全微分方程,恰当微分方程 - 210 - 附录C 词汇表 §C.6 I information criterion intensive form imaginary number 信息准则 紧凑形式 虚数 - 211 - §C.7 L §C.7 L long range dependence leptokurtosis and fat-tail 长程相依 高峰厚尾 - 212 - 附录C 词汇表 §C.8 M market clearing martigale multistep decision process 市场出清 鞅 多阶段决策过程 - 213 - §C.9 O §C.9 O over shooting 过度调整 - 214 - 附录C 词汇表 §C.10 P phase paths phase trajectories principle of parsimony 相路径 相轨道 节俭原则。模型参数尽可能地少并能适当地模仿出样本的性质。 - 215 - §C.11 Q §C.11 quantile Q 分位数 - 216 - 附录C 词汇表 §C.12 R range ratchet effect recurrence resource allocating Problem 值域,范围,变程,区域;极差 棘轮效应 递归,循环 资源分配问题 - 217 - §C.13 S §C.13 S stationary state steady state sufficient and necessary condition supremum stochastic decision process shortest Path Problem singular sparce matrix splitting stiffness matrix stakeholders subregion 静止状态。相关变量保持不变,增长率为零 稳定状态。所有有关变量均按同一比率增长 充要条件 上确界 随机性决策过程 最短路线问题 奇异的 稀疏矩阵 分赃 刚度矩阵 利益相关者 子域 - 218 - 附录C 词汇表 §C.14 T tradeoff triangular mesh 折衷 三角形网格 - 219 - §C.15 U §C.15 U uncertainty undetermined uniform refinement uniform triangle net utility utility possibilities frontier 不确定性 多种出现概率不知的结果发生的可能 未定的 均匀加密 均匀三角形网络 效用 从消费一种物品或从事一项活动中所得到的满意程度 从两人效用水平的角度评价的所有有效率的资源配置的曲线 - 220 - 附录C 词汇表 §C.16 V variable cost variational theory variance proportion volatility clustering 可变成本 随产出水平变动而变动的一项成本 变分法 方差分量 波动集群 - 221 - §C.17 W §C.17 W wave equation welfare economics welfare effects 波动方程 福利经济学 对市场和经济政策的规范评价 政府政策所导致的利益与损失 - 222 - 参考文献 参考文献 [1] 李子奈, 叶阿忠. 高等计量经济学. 清华大学出版社, 2002 [2] 李子奈编著. 计量经济学. 北京: 高等教育出版社, 2000 [3] Robert S. Pindyck, Daniel L. Rubinfeld. 计量经济模型与经济预测. 北京: 机械工业出版社, 1999 [4] 伍超标. 经济计量学导论. 北京: 中国统计出版社, 1998 [5] 胡定国等编著. 简明数学词典. 北京: 科学出版社, 2000 [6] 蒋中一. 数理经济学的基本方法. 北京: 商务印书馆, 2004 [7] Maurice Weir. 托马斯微积分(第十版). 北京: 高等教育出版社, 2003 [8] 李庆杨, 王能超, 易大义编. 数值分析. 武汉: 华中科技大学出版社, 1986 [9] [美]蒋中一, 王永宏. 动态最优化基础. 北京: 商务印书馆, 1999 [10] [美] A. 帕普里斯, S. U. 佩莱. 概率、随机变量与随机过程(第四版). 西安: 西安交通大学出 版社, 2004 [11] Knut Sydsaeter, Arne Strom, Peter Berck. 经济学家数学手册. 上海: 复旦大学出版社, 2001 [12] 安吉尔·德·拉·弗恩特. 经济数学方法与模型. 上海: 上海财经大学出版社, 2003 [13] [俄] A. D. 亚历山大洛夫. 数学它的内容,方法和意义(三卷本). 北京: 科学出版社, 2001 [14] [美] 约翰 L. 卡斯蒂. 20世纪数学的五大指导理论. 上海: 上海教育出版社, 2000 [15] [美]Walter Rudin(第三版). 数学分析原理. 北京: 机械工业出版社, 2004 [16] Yvonne M.M. Bishop, Stephen E. Fienberg, Paul W. Holland. 离散多元分析理论与实践. 上海: 中国统计出版社, 1998 [17] 张定胜. 计量经济学. 武汉: 武汉大学出版社, 2005 [18] 钱伯海主编. 统计学. 厦门: 厦门大学出版社, 2001 [19] 吴喜之. 现代贝叶斯统计学. 北京: 中国统计出版社, 2000 [20] 何晓群主编. 现代统计分析方法与应用. 北京: 中国人民大学出版社, 1998 [21] 孙尚拱. 隐变量分析法简介. 数理统计与管理. 1 2002, 21(1) [22] [美]M. R. 斯皮格尔, L. J. 斯蒂芬斯. 统计学(第三版). 北京: 科学出版社, 2002 [23] [美] 沃尔特. 恩特斯. 应用计量经济学(第二版). 北京: 高等教育出版社, 2006 [24] [美] J. M. 伍德里奇. 计量经济学导论现代观点. 北京: 中国人民大学出版社, 2003 [25] 高惠璇等编译. SAS系统BASE SAS软件使用手册. 北京: 中国统计出版社, 1997 [26] 高惠璇等编译. SAS系统SAS/ETS软件使用手册. 北京: 中国统计出版社, 1998 - 223 -