干货!SQL性能优化,书写高质量SQL语句( 二 )


12.Inner join 和 left join、right join、子查询

  • 第一:inner join内连接也叫等值连接是,left/rightjoin是外连接 。
SELECT A.id,A.name,B.id,B.name FROM A LEFT JOIN B ON A.id =B.id;SELECT A.id,A.name,B.id,B.name FROM A RIGHT JOIN ON B A.id= B.id;SELECT A.id,A.name,B.id,B.name FROM A INNER JOIN ON A.id =B.id;经过来之多方面的证实 inner join性能比较快,因为inner join是等值连接,或许返回的行数比较少 。但是我们要记得有些语句隐形的用到了等值连接,如:
SELECT A.id,A.name,B.id,B.name FROM A,B WHERE A.id = B.id;
推荐:能用inner join连接尽量使用inner join连接
  • 第二:子查询的性能又比外连接性能慢,尽量用外连接来替换子查询 。
反例
mysql是先对外表A执行全表查询,然后根据uuid逐次执行子查询,如果外层表是一个很大的表,我们可以想象查询性能会表现比这个更加糟糕 。
Select* from A where exists (select * from B where id>=3000 and A.uuid=B.uuid);执行时间:2s左右
正例
Select* from A inner join B ON A.uuid=B.uuid where b.uuid>=3000;这个语句执行测试不到一秒;执行时间:1s不到
  • 第三:使用JOIN时候,应该用小的结果驱动大的结果
left join 左边表结果尽量小,如果有条件应该放到左边先处理,right join同理反向 。如:
反例
Select * from A left join B A.id=B.ref_id whereA.id>10正例
select * from (select * from A wehre id >10) T1 left join B on T1.id=B.ref_id;13.exist 代替 in反例
SELECT * from A WHERE id in ( SELECT id from B )正例
SELECT * from A WHERE id EXISTS ( SELECT 1 from A.id= B.id )分析:
in 是在内存中遍历比较
exist 需要查询数据库,所以当B的数据量比较大时,exists效率优于in**
in()只执行一次,把B表中的所有id字段缓存起来,之后检查A表的id是否与B表中的id相等,如果id相等则将A表的记录加入到结果集中,直到遍历完A表的所有记录 。
In 操作的流程原理如同一下代码
List resultSet={};Array A=(select * from A);Array B=(select id from B);for(int i=0;i<A.length;i++) {for(int j=0;j<B.length;j++) {if(A[i].id==B[j].id) {resultSet.add(A[i]);break;}}}return resultSet;可以看出,当B表数据较大时不适合使用in(),因为会把B表数据全部遍历一次
如:A表有10000条记录,B表有1000000条记录,那么最多有可能遍历10000*1000000次,效率很差 。
再如:A表有10000条记录,B表有100条记录,那么最多有可能遍历10000*100次,遍历次数大大减少,效率大大提升 。
  结论:in()适合B表比A表数据小的情况
exist()会执行A.length()次,执行过程代码如下
List resultSet={};Array A=(select * from A);for(int i=0;i<A.length;i++) {if(exists(A[i].id) {//执行select 1 from B where B.id=A.id是否有记录返回resultSet.add(A[i]);}}return resultSet;当B表比A表数据大时适合使用exists(),因为它没有那么多遍历操作,只需要再执行一次查询就行 。
如:A表有10000条记录,B表有1000000条记录,那么exists()会执行10000次去判断A表中的id是否与B表中的id相等 。
如:A表有10000条记录,B表有100000000条记录,那么exists()还是执行10000次,因为它只执行A.length次,可见B表数据越多,越适合exists()发挥效果 。
再如:A表有10000条记录,B表有100条记录,那么exists()还是执行10000次,还不如使用in()遍历10000*100次,因为in()是在内存里遍历比较,而exists()需要查询数据库,
我们都知道查询数据库所消耗的性能更高,而内存比较很快 。 

 

【干货!SQL性能优化,书写高质量SQL语句】


推荐阅读