干货！SQL性能优化，书写高质量SQL语句( 二 ) _SQL

12.Inner join 和 left join、right join、子查询

第一：inner join内连接也叫等值连接是，left/rightjoin是外连接。

SELECT A.id,A.name,B.id,B.name FROM A LEFT JOIN B ON A.id =B.id;SELECT A.id,A.name,B.id,B.name FROM A RIGHT JOIN ON B A.id= B.id;SELECT A.id,A.name,B.id,B.name FROM A INNER JOIN ON A.id =B.id;

经过来之多方面的证实 inner join性能比较快，因为inner join是等值连接，或许返回的行数比较少。但是我们要记得有些语句隐形的用到了等值连接，如：
SELECT A.id,A.name,B.id,B.name FROM A,B WHERE A.id = B.id;
推荐：能用inner join连接尽量使用inner join连接

第二：子查询的性能又比外连接性能慢，尽量用外连接来替换子查询。

反例
mysql是先对外表A执行全表查询，然后根据uuid逐次执行子查询，如果外层表是一个很大的表，我们可以想象查询性能会表现比这个更加糟糕。
Select* from A where exists (select * from B where id>=3000 and A.uuid=B.uuid);执行时间：2s左右
正例
Select* from A inner join B ON A.uuid=B.uuid where b.uuid>=3000;这个语句执行测试不到一秒；执行时间：1s不到

第三：使用JOIN时候，应该用小的结果驱动大的结果

left join 左边表结果尽量小，如果有条件应该放到左边先处理，right join同理反向。如：
反例
Select * from A left join B A.id=B.ref_id whereA.id>10正例
select * from (select * from A wehre id >10) T1 left join B on T1.id=B.ref_id;13.exist 代替 in反例
SELECT * from A WHERE id in ( SELECT id from B )正例
SELECT * from A WHERE id EXISTS ( SELECT 1 from A.id= B.id )分析:
in 是在内存中遍历比较
exist 需要查询数据库，所以当B的数据量比较大时，exists效率优于in**
in()只执行一次，把B表中的所有id字段缓存起来，之后检查A表的id是否与B表中的id相等，如果id相等则将A表的记录加入到结果集中，直到遍历完A表的所有记录。
In 操作的流程原理如同一下代码

List resultSet={};Array A=(select * from A);Array B=(select id from B);for(int i=0;i<A.length;i++) {for(int j=0;j<B.length;j++) {if(A[i].id==B[j].id) {resultSet.add(A[i]);break;}}}return resultSet;

可以看出，当B表数据较大时不适合使用in()，因为会把B表数据全部遍历一次
如：A表有10000条记录，B表有1000000条记录，那么最多有可能遍历10000*1000000次，效率很差。
再如：A表有10000条记录，B表有100条记录，那么最多有可能遍历10000*100次，遍历次数大大减少，效率大大提升。
结论：in()适合B表比A表数据小的情况
exist()会执行A.length()次，执行过程代码如下

List resultSet={};Array A=(select * from A);for(int i=0;i<A.length;i++) {if(exists(A[i].id) {//执行select 1 from B where B.id=A.id是否有记录返回resultSet.add(A[i]);}}return resultSet;

当B表比A表数据大时适合使用exists()，因为它没有那么多遍历操作，只需要再执行一次查询就行。
如：A表有10000条记录，B表有1000000条记录，那么exists()会执行10000次去判断A表中的id是否与B表中的id相等。
如：A表有10000条记录，B表有100000000条记录，那么exists()还是执行10000次，因为它只执行A.length次，可见B表数据越多，越适合exists()发挥效果。
再如：A表有10000条记录，B表有100条记录，那么exists()还是执行10000次，还不如使用in()遍历10000*100次，因为in()是在内存里遍历比较，而exists()需要查询数据库，
我们都知道查询数据库所消耗的性能更高，而内存比较很快。