为啥说principal component analysis 隐含条件是数据是服从多维高斯分布( 二 )
■网友
主成分是协方差阵谱分解后得到的各个正交的向量。由大数定律可以得知,来自任意分布的i.i.d.样本的经验协方差阵都依概率收敛到真实的协方差阵,通常下我们做主成分分析的那个协方差阵其实是这个经验协方差阵。所以主成分分析是有2个误差的:一个是用经验协方差阵代替真实的协方差阵带来的误差;另一个是对主成分截断后,舍弃的项带来的误差。你所说的问题,可能是出现在用经验协方差阵近似协方差阵这个环节中。是没有假定样本是i.i.d.的,所以牵扯出独立的问题了?因为独立样本,在正交空间的不同方向上的投影也应是独立的才对。看过一个很有趣的观点,可能会对你有点儿启发:随机变量X在给定某一条件F下的条件期望,可以看作是X在F生成的空间上投影后那个随机变量的期望。另,只有高斯分布下独立与不相关是等价的,否则仅能由独立推出不相关。
推荐阅读
- 为啥看到书柜上的藏书会有心旷神怡的感觉
- 为啥知乎上普便有一种【我在北上广深打工,所以拥有更好的视野】这样的错觉
- 为啥工商银行的用户体验如此之差
- 汽车|看了中消协4S店服务测评调查结果,终于知道法系车为啥卖不好了
- 你为啥从窝窝商城离职?
- 为啥5G和2.4G默认的BSSID是相同的
- 为啥电器实体店的价格比淘宝贵那么多
- 现在在线学习视频有很多了,为啥大部分人还是喜欢下载下来观看
- 为啥到现在你还没有女朋友 ?
- 天赐的声音|33岁张雨绮为啥总离婚?看过这些照片就明白了,都是性感惹得祸