都说spark那么牛，有没有啥坑啊( 三 ) 您好

为什么会有这些对象在里面，我们看下源码

8.JDO内存泄露
多达10万多个JDOPersistenceManage

【都说spark那么牛，有没有啥坑啊】

9.listerner内存泄露
通过debug工具监控发现，spark的listerner随着时间的积累，通知(post)速度运来越慢
发现所有代码都卡在了onpostevent上

jstack的结果如下

研究下了调用逻辑如下，发现是循环调用listerners，而且listerner都是空执行才会产生上面的jstack截图

通过内存发现有30多万个linterner在里面

发现都是大多数都是同一个listener,我们核对下该处源码

最终定位问题
确系是这个地方的BUG ，每次创建JDBC连接的时候，spark就会增加一个listener，时间久了，listener就会积累越来越多针对这个问题我简单的修改了一行代码，开始进入下一轮的压测

二十二、spark源码调优测试发现，即使只有1条记录，使用 spark进行一次SQL查询也会耗时1秒，对很多即席查询来说1秒的等待，对用户体验非常不友好。针对这个问题，我们在spark与hive的细节代码上进行了局部调优，调优后，响应时间由原先的1秒缩减到现在的200~300毫秒。
以下是我们改动过的地方
1.SessionState 的创建目录占用较多的时间

另外使用Hadoop namenode HA的同学会注意到，如果第一个namenode是standby状态，这个地方会更慢，就不止一秒，所以除了改动源码外，如果使用namenode ha的同学一定要注意，将active状态的node一定要放在前面。

都说spark那么牛，有没有啥坑啊( 三 )

推荐阅读

娱悦欢百年|甜美的紧身裙女神，小姐姐打造完美曲线

北方方言|“南腔北调”，为何南方是“腔”，北方是“调”？

阿尔山在哪个省阿尔山在哪个省什么位置

铭赞网络|陕西恒硕特钢分享下半年要关注20G无缝钢管钢材库存变化节奏

中国已有17省区市委托投资基本养老保险基金8580亿元

充电器|PowiGaN芯片是啥？充电器为啥不能少了它？

秋叶援智能家居万物互联，从热水器开始—圈厨热水器体验

阴道炎怎么检查

类节目|张晋含泪告白蔡少芬《妻子4》温暖收官赚足眼泪

爱卡汽车环比增长15.4%，奇瑞集团四月销量超4万

笑看尘世|一个95后佛系老人家日常出行装备，透露着贫穷气息的EDC

中国|祝贺！广西2家企业入围2020中国民营企业500强

染色体|性别真的只有两种吗？

杭州虎跑泉西湖之泉以虎跑为最西山之茶以龙井为最

展现出|路人街拍，美女搭配长裙，展现出了几分飘逸的美感

社保局每个月打入退休人员医保卡的钱，会随养老金的上调增加吗？

中超▲北京山东云南出局：上海承接中超比赛，赛会制四大地点基本确定

星座小可爱|财运翻倍，财源广进赚大钱的生肖，9月

广深@中国发展“最稳定”的2座新一线城市，霸主地位比肩北上广

红茶喝多了会中毒吗,喝红茶为什么减肥