您的当前位置:首页正文

计量经济学第十章习题(龚志民)fixed

2023-05-22 来源:伴沃教育
第10章 模型设定与实践

问题

10.1 模型设定误差有哪些类型?如何诊断? 答:模型设定误差主要有以下四种类型:

1. 漏掉一个相关变量; 2. 包含一个无关的变量; 3. 错误的函数形式; 4. 对误差项的错误假定。

诊断的方法有:1.侦察是否含有无关变量;2.残差分析,拉姆齐(Ramsey)的RESET检验法,DM(Davidsion-MacKinnon:戴维森麦-克金龙)检验;3.拟合优度、校正拟合优度、系数显著性、系数符合的合理性。 10.2 模型遗漏相关变量的后果是什么?

答:模型遗漏相关变量的后果是:所有回归系数的估计量是有偏的,除非这个被去除的变量与每一个放入的变量都不相关。常数估计量通常也是有偏的,从而预测值是有偏的。由于放入变量的回归系数估计量是有偏的,所以假设检验是无效的。系数估计量的方差估计量是有偏的。

10.3 模型包含不相关变量的后果是什么?

答:模型包含不相关变量的后果是:系数估计量的方差变大,从而估计量的精度下降。 10.4 什么是嵌套模型?什么是非嵌套模型?

答:如果两个模型不能被互相包容,即任何一个都不是另一个的特殊情形,便称这两个模型是非嵌套的。如果两个模型能互相包容,即其中一个是另一个的特殊情形,便称这两个模型是嵌套的。

10.5 非嵌套模型之间的比较有哪些方法?

答:非嵌套模型之间的比较方法有:拟合优度或校正拟合优度、AIC(Akaike’s information criterion)准则、SIC(Schwarz’s information criterion)准则和HQ(Hannnan-Qinn criterion)准则。拉姆齐(Ramsey)的RESET检验法,DM(Davidsion-MacKinnon:戴维森麦-克金龙)检验。

习题

10.6 对数线性模型在人力资源文献中有比较广泛的应用,其理论建议把工资或收入的对数

1 / 9

作为因变量。如果教育投资收益率为r,则接受一年教育的工资为w1(1r)w0,w0是基准工资(未接受教育)。如果接受教育的年限为s,则工资为wt(1r)tw0,取对数

lnwtlnw0tln(1r)12t。工龄可能有类似的影响。但年龄的影响可能有差异,

直观上看,往往呈现“低-高-低”的特征,于是可用二次关系检验(看是否有峰形关系)。对于教育年限和工龄或许也有二次效应。因此,一般模型构建如下

ln(wage)12DEUC3EXPER4AGE5EDUC2 6EXPER7AGEu22

请你利用DATA10-5中的数据尝试估计出最恰当的模型。你有什么结论? 答:估计方程(1):

ˆˆDEUCˆEXPERˆAGEˆEDU2+ˆEXPER2Ln(wage)123456

2ˆ AGEu7可得:

Ln(wage)7.330.09DEUC0.01EXPER0.0004AGE0.011EDUC2

t(9.06) (1.077) (0.57) (0.01) (1.84) +0.0004EXPER(2.11E05)AGE22

t(0.38) (0.06) R20.3806 R20.292从其显著性可知,AGE及其平方是不显著的。 去除AGE和AGE,得到模型(2):

2Ln(wage)7.330.09DEUC0.01EXPER0.01EDUC2+0.0004EXPER2 t(25.20)(1.07) (0.63) (1.87) (0.39) R0.3792

从其AIC,SIC,HQ指标都下降可以看出,模型(2)比模型(1)要好。但是从其显著性可以看出,EXPER及其平方是不显著的。利用瓦尔德检验,可以看出EXPER及其平方是联合显著的。去掉EXPER,可得:

2Ln(wage)7.290.09DEUC0.02EXPER0.01EDUC2 t (1.05) (3.89) (1.88) R0.332

可以看出AIC,HQ,SIC指标均下降,校正拟合优度上升。(3)才是最恰当的模型。 10.7 根据DATA4-6中的数据,利用拉姆齐的RESET方法比较下面的两个模型:

price12lotsize3sqrft4bdrmsu

2 / 9

ln(price)12ln(lotsize)3ln(sqrft)4bdrmsu

还有什么其它方法可用来比较这两个模型?

ˆˆlotsizeˆsqrftˆbdrms 答:估计方程:price1234得:

price21.770.002lotsize0.122sqrft13.85bdrms t(0.74) (3.22) (9.28) (1.54) R0.6724232

ˆˆlotsizeˆsqrftˆbdrmsˆpriceˆprice 拟合方程:price123456可得:

price166.100.0002lotsize0.018sqrft2.175bdrms0.0003price2

t(0.523) (0.030) (0.059) (0.064) (0.049) (1.55E06)price3

t (0.236) R20.70622(RURR)/(km)(0.7060.6724)/(64)Fc4.6857 2(10.706)/(886)(1RU)/(nk)给定显著性水平为0.05,则查表知:FcF*,则拒绝零假设。则5和6是联合显著的。由此可知函数形式是误设的。

估计方程:ln(price)12ln(lotsize)3ln(sqrft)4bdrmsu 可得:

ln(price)1.2970.168ln(lotsize)0.700ln(sqrft)0.037bdrms t(1.99) (4.39) (7.54) (1.34) R20.643加入估计值的平方项和立方项: 可得:

ln(price)87.894.18ln(lotsize)17.35ln(sqrft)0.93bdrms t(0.37) (0.33) (0.33) (0.33) 32 +3.91log(price)0.19log(price) t(0.30) (0.26) R20.6643 / 9

22(RURR)/(km)(0.6640.643)/2则Fc2.625 2(10.664)/(886)(1RU)/(nk)则给定显著性水平0.05,查表可知FcF*3.108,由此可知5和6是联合不显著的,模型设定正确。

通过上述方法,我们可以看出对数模型比线性模型更好。 另外,我们还可以用戴维森-麦金龙检验。

10.8 对于给定的两个非嵌套模型,是否一定可以构造一个糅合模型使其包含两个非嵌套模型作为特殊情形?如果回答是否定的,请举例说明。 答:不一定,比如模型:

Y12Xu,logY12logXv

10.9 如果对模型(10.8)做如下修正:

Y12X3year4year2u

(1) 估计这个模型。

(2) 如果year2的系数是统计显著的,你如何评价回归方程(10.8)? (3) year2的系数为负,其直观含义是什么? 答:(1)估计方程为:

ˆ17727350.403X1826.38year0.470year2Yt(0.82) (3.18) (0.83) (0.84) R0.9842

(2)如果year2的系数是统计显著的,则说明10.8遗漏变量。

(3)year2的系数为负的直观含义是进出口商品的支出随着时间是以递减的速率变化的。 10.10 再论公共汽车需求的影响:在第四章的例4-2中(DATA4-2),把所有变量都取对数,构建合适的对数模型。将你得到的对数模型与例4-2中的模型进行比较(用你能想到的所有方法),能用F-包容检验方法吗?

答:在第四章中取对数之后的一般模型(1)为:

ln(BusTravl)12ln(Fare)3ln(Gasprice)4ln(Income)5ln(Pop) 6ln(Density)7ln(Landarea)+u

估计该模型可得:

4 / 9

ln(BusTravl)44.710.48ln(Fare)1.73ln(Gasprice)4.85ln(Income)1.69ln(Pop) t(2.15) (1.12) (0.69) (4.63) (0.63) 0.28ln(Density)0.82ln(Landarea) t(0.10) (0.30) R20.657 AIC2.385 SIC2.681 HQ2.492可以看出,ln(Density)是最不显著的,删掉ln(Density)有模型(2):

ln(BusTravl)46.610.49ln(Fare)1.71ln(Gasprice)4.85ln(Income)+1.96ln(Pop) t(4.82) (1.26) (0.70) (4.70) (7.06) 1.09ln(Landarea) t(4.58) R20.657 AIC2.34 SIC2.59 HQ2.43目前,ln(Gasprice)的系数估计量是最不显著的,则删掉此变量有模型(3):

ln(BusTravl)46.200.43ln(Fare)4.77ln(Income)1.87ln(Pop)1.02ln(Landarea) t(4.82) (1.15) (4.69) (7.84) (4.85) R20.652 AIC2.30 SIC2.51 HQ2.38删掉不显著的ln(Fare),有模型(4):

ln(BusTravl)45.854.73ln(Income)1.82ln(Pop)0.97ln(Landarea) t(4.77) (4.63) (7.72) (4.70)

R20.639 AIC2.29 SIC2.46 HQ2.35所有的系数都是显著的,而且AIC,SIC,HQ是几个模型中最小的。由此可见,模型(4)是最优的。

例4-2中的最优模型B为:

Bustravl12Income3Pop4Densityu 则可以看出不能使用F-包容检验方法。 使用RESET检验, 对于模型:

Bustravl12Income3Pop4Densityu

5 / 9

ˆ2Bustravl1782.670.09Income0.14Pop0.06Density0.0002Y t(1.95) (1.2) (0.2) (1.11) (2.76)得到:

3ˆ (1.38E08)Yu t(3.01) R20.941易知,拟合值的平方项和立方项是联合显著的(单个显著),所以可以判断函数形式有误。 对于模型:

ln(BusTravl)12ln(Income)3ln(Pop)4ln(Landarea)u 使用RESET可得:

ln(BusTravl)1106.63120.38ln(Income)46.37ln(Pop)24.71ln(Landarea) t(1.53) (1.53) (1.54) (1.54)

3.27ln(BusTravl)0.14ln(BusTravl)u t (1.44) (1.34) R20.66523

使用联合显著性检验可知,拟合值的平方项和立方项是联合不显著的,没有发现函数形式有误。

由此可见,对数模型比线性模型要好。 使用戴维森-麦金龙检验:

ˆ加入模型A有: 将模型B的拟合值Y1对数模型检验(因变量为log(Bustravl))

变量 C

LOG(Income) LOG(Pop) LOG(Landarea)

系数 45.31335 -4.617588 1.680310 -0.913786 3.70E-05 0.639930

标准差 9.862810 1.086838 0.480265 0.269868 0.000110

t统计量 4.594365 -4.248643 3.498715 -3.386049 0.336080

概率 0.0001 0.0002 0.0013 0.0018 0.7388

ˆ Y1拟合优度

ˆ的系数是不显著的,接受模型A,拒绝模型B。 Y1ˆ加入模型B有: 将模型A的拟合值Y2线性模型检验(因变量为Bustravl)

变量 C Income

系数 1953.076 -0.138151

标准差 1464.339 0.101101 6 / 9

t-统计值 1.333759 -1.366461

概率 0.1909 0.1805

Pop Density 1.283776 0.113032 0.192118 0.920195

0.388315 0.061806 0.242054

3.306021 1.828828 0.793700

0.0022 0.0760 0.4327

ˆ Y2拟合优度

ˆ的系数是不显著的,接受模型B,拒绝模型A。 Y2由此可见,使用戴维森-麦金龙检验无法判断出模型的好坏。

10.11 数据DATA10-6给出了美国50个州以及可伦比亚特地区制造业数据。因变量是产出(用增量值度量,单位1000美元),自变量是工作小时及资本支出。 (1) 利用标准的线性模型预测产出。 (2) 建立对数线性模型。

(3) 利用戴维森-麦金龙J检验方法比较上述两个模型。

答:(1)估计线性模型得到(X2是工作小时,X3是资本投入,Y是产出)

Y297459.847.83X29.96X3 t (6.8) (10.17) R0.982

(2)估计对数模型得到:

ln(Y)3.890.47ln(X2)0.52ln(X3) t (4.73) (5.38) R0.962

(3)将线性模型(1)的估计值Y1代入对数模型(2),估计模得到: ln(Y)12ln(X2)3ln(X3)4Y1u Variable C LOG(X2) LOG(X3) YF F-statistic Prob(F-statistic) Coefficient 3.968127 0.464640 0.517901 2.80E-10 422.0384 0.000000 Std. Error 0.561521 0.101547 0.099254 1.37E-09 t-Statistic 7.066752 4.575603 5.217961 0.204468 Prob. 0.0000 0.0000 0.0000 0.8389 1.948245 Durbin-Watson stat

Y1的系数不显著,接受对数模型(2)。

将对数模型(2)的Y2带入模型(1)中,估计模型:

7 / 9

Y12X23X34Y2u (4)

可得: Variable C X2 X3 Y2 R-squared

Adjusted R-squared Coefficient 484683.7 255.7681 37.20734 -3.447238 0.984873 0.983908 Std. Error 1131772. 60.74338 7.973049 1.002212

t-Statistic 0.428252 4.210633 4.666639 -3.439630

Prob. 0.6704 0.0001 0.0000 0.0012 43217548 44863661 Mean dependent var S.D. dependent var 可以看出,Y2的系数是显著的,则拒绝模型1,接受模型2。 综和判断,模型2比模型1好。

10.12 考虑美国1980-1998年间的货币需求函数:

Mt1Yt2rt3eut

其中M表示实际货币需求,利用货币的M2定义;Y是实际GDP;r表示利率。利用DATA10-7的数据,估计上述货币需求函数。

(1) 估计货币需求对收入和利率的弹性。

(2) 如果对模型(M/Y)t1rt2eut进行拟合,你怎样解释所得结果? (3) 哪个模型更好?

提示:为了将名义变量变为实际变量,将M和GDP除以CPI,利率变量则不需要除以CPI。数据中给出了两个利率,一个是3月期国债短期利率,一个是30年期国债长期利率。 答:将模型两端同时取对数可得模型(1): ln(M)12lnYt3lnrtut,

(1)由于货币需求是当期的,所以利率应是短期利率。 估计该模型可得:

ln(M)1.240.52lnYt0.03lnrt t(1.98) (3.60) (0.50) R0.7292

(2)将模型两端取对数可得模型(2): ln(M)lnru ,其中ln11

12ttYt8 / 9

估计方程得:

M)0.800.11lnrt Yt t(10.58) (2.73) R20.305ln(从结果中可以看出

M与r是存在正的相关关系的。 Y(3)第二个方程本质上是第一个方程加上限制:21。但从第一个方程容易检验,2显著不为1。故第一个方程更好。

9 / 9

因篇幅问题不能全部显示,请点此查看更多更全内容