面板数据模型(几种面板数据模型的解释)


面板数据模型(几种面板数据模型的解释)

文章插图
面板数据模型(几种面板数据模型的解释)
微博Qzone微信几种面板数据模型的解释沃亚知识产权2020-05-11 09:51:53
1混合效应模型
就是各省都一样,就是同一个方程,截距项和斜率项都一样 。
Yit = c+bxit+it c和b是常数 。
2固定效应模型和随机效应模型 。
即各省有相同的部分,即斜率项相同;还有不同的部分,也就是不同的截距项 。
2.1固定效应模型——效应模型
yit=ai+bxit+?it cov(ci,xit)≠0
固定效应方程意味着跨组差异可以用不同的常数项来表征 。每个ai被视为待估计的未知参数 。xit中任何不随时间变化的变量都会模拟因人而异的常数项 。
2.2随机效应模型
yit=a+ui+bxit+?it cov(a+ui,xit)=0
a是常数项,是不可观测差的平均值,ui是第I次观测的随机差,不随时间变化 。
3变系数模型(变系数也分为固定效应和随机效应)
对于每一组,使用一个方程进行估计 。即各省线性回归方程的截距和斜率项不一样 。
yit=ui+bixit+?it
1.混合估计模型是指每个截面估计方程的截距和斜率项是相同的,也就是说回归方程的估计结果在截距和斜率项上是相同的 。如果我们看各个省份,历年来收入对消费的影响 。那么所有省份的回归方程都是完全一样的,无论截距还是斜率 。
2.随机效应模型和固定效应模型的斜率相同,但截距不同 。区别在于截距项和自变量是否相关,不相关选择随机效应模型,相关选择固定效应模型 。然后各省回归方程斜率相同,不同的是截距项,也就是平移项 。
3.变系数模型,即无论是截距项还是系数项,对于不同的省份,每个省份都有一个回归方程,是最适合自己的回归方程,不考虑整体 。各省的回归方程在斜率和截距上与其他省份不同 。
简而言之,从混合估计模型,到变截距模型,再到变系数模型,对省份的考察从完全服从整体,没有个体性(回归方程是从整体的角度确定和估计的,是一刀切的,完全没有差异性和个体性,完全牺牲自己),到任意性,完全个性化(信息资源网中每个省份都有一个最适合自己的回归方程) 。也就是从完全非个人化到完全个人化 。
第二,一个医疗哥们的固定效用模型和随机效用模型的判别方法 。
关于随机效应模型和固定效应模型的选择,通常的做法是对两种模型进行分析,看结果是否一致 。如果符合很少或没有异质性,选择固定效应模型 。如果结果不一致且异质性,则选择随机效应模型,并进行亚组分析,寻找异质性来源,得出保守结论 。方法部分的几个荟萃分析说:“所有的不良结果测量都是用随机效应模型确定的”,“所有的汇总结果测量都是用DerSimonian和Laird描述的随机效应模型确定的”.为什么我们直接用随机效应模型而不用固定效应模型?随机效应模型是因为RCT的异质性大而直接使用的吗?
1.模型的使用是根据12的值确定的,大部分认为存在异质性> 50%,使用随机效应模型≤50%,使用固定的,具有异质性,通过敏感性分析或亚组分析,探索异质性的来源,但两者都是定性的,可能发现不了 。即使你已经做了很多研究,你也可以做一个元回归来发现异质性 。
2.在任何情况下都使用随机效应模型,因为如果异质性很小,那么随机效应模型和固定效应模型的最终组合结果不会有很大差异 。当异质性较大时,只能使用随机效应模型,所以可以说在任何情况下都可以使用随机效应模型 。3.还有一种模型,看P的值,一般建议P的阈值是0.1,现在大多用0.05,也就是P > 0.05 。
其实个人更喜欢第三种,因为P值可以看出是否存在异质性,I2是定量描述一致性的大小 。
本来随机效应的假设是我们的样本是从一个大矩阵中抽取的,所以大家的期望(均值)是一样的;如果我们的样本几乎都是总体,不能说个体差异是随机的,那么固定效果更好;这是从模型设定的角度来说的 。但信息资源网络是随机效应模型的一个致命缺陷,即假设cov(x,ui)=0,而固定效应不需要这个假设 。豪斯曼的检验所做的就是检验这个假设对于随机效应模型是否成立 。如果不成立,则随机效应模型的估计是有偏差的 。即使B-P LM测试显示存在随机效应,你也别无选择 。
总结:检验固定效应是否显著,使用f检验(对比模型为池化);检验随机效应是否显著,采用LM检验(对比模型也是池化的);固定检验和随机检验哪个更合适,用豪斯曼检验(比较fe和be) 。


推荐阅读