group by慢查询优化

一、问题背景现网出现慢查询,在500万数量级的情况下,单表查询速度在30多秒,需要对sql进行优化,sql如下:

group by慢查询优化

文章插图
 
我在测试环境构造了500万条数据,模拟了这个慢查询 。
简单来说,就是查询一定条件下,都有哪些用户的 。很简单的sql,可以看到,查询耗时为37秒 。
说一下App_account字段的分布情况,随机生成了5000个不同的随机数,然后分布到了这500万条数据里,平均来说,每个app_account都会有1000个是重复的值,种类共有5000个 。
二、看执行计划
group by慢查询优化

文章插图
 
可以看到,group by字段上我是加了索引的,也用到了 。
三、优化说实话,我是不知道该怎么优化的,这玩意还能怎么优化啊!先说下,下面的思路都是没用的 。
思路一:
后面应该加上 order by null;避免无用排序,但其实对结果耗时影响不大,还是很慢 。
group by慢查询优化

文章插图
【group by慢查询优化】 
思路二:
where条件太复杂,没索引,导致查询慢,但其实哪怕where条件不动,只要把group by去掉,就非常快 。所以应该也不是where条件的问题 。
group by慢查询优化

文章插图
 
思路三:
既然group by慢,换distinct试试??(这里就是本篇博客里说的神奇的地方了)
group by慢查询优化

文章插图
 
卧槽???!!!这是什么情况,瞬间这么快了??!!!
虽然知道group by和distinct有很小的性能差距,但是真没想到,差距居然这么大!!!大发现啊!!
四、你以为这就结束了吗我是真的希望就这么结束了,那这个问题就很简单的解决了,顺便还自以为是的发现了一个新知识 。
但是!
这个bug转给测试后,测试一测,居然还是30多秒!?这是什么情况!!???
我当然是不信了,去测试电脑上执行sql,还真是30多秒 。。。
我又回我的电脑上,连接同一个数据库,一执行sql,0.8秒!?
什么情况,同一个库,同一个sql,怎么在两台电脑执行的差距这么大!
后来直接在服务器上执行:
group by慢查询优化

文章插图
 
醉了,居然还是30多秒 。。。。
那看来就是我电脑的问题了 。
后来我用多个同事的电脑实验,最后得出的结论是:
是因为我用的SQLyog!
哎,现在发现了,只有用sqlyog执行这个“优化后”的sql会是0.8秒,在navcat和服务器上直接执行,都是30多秒 。
那就是sqlyog的问题了,现在也不清楚sqlyog是不是做什么优化了,这个慢查询的问题还在解决中(我觉得问题可能是出在MySQL自身的参数上吧) 。
这里只是记录下这个坑,sqlyog执行sql速度,和服务器执行sql速度,在有的sql中差异巨大,并不可靠 。




    推荐阅读