MySQL 数据库铁律

好的数据库规范有助于减少软件实现的复杂度,降低沟通成本,本铁律主要涵盖了建库建表、建索引、写 SQL、ORM 映射等方面的处理约定 。
1.建库铁律
-铁律Level备注
字符集使用 utf-8 。如果存储的是表情则选用 utf8mb4 进行存储 。强制
排序规则使用 utf8_general_ci强制
2.建表铁律
-铁律Level备注
注释一定要有字段注释 。强制
编码使用 utf-8 。如果存储的是表情则选用 utf8mb4 进行存储 。强制
是否概念的字段必须用 is_xx 命名,数据类型是 unsigned tinyint(1是0否)例如 is_deleted(1删除0未删除) 。强制任何字段如果非负数必须unsigned
表名、字段名只能使用小写字母、下划线或者数字;禁止以下划线或者数字开头;禁止两个下划线之间只出现数字;禁用保留字;表名禁止使用复数名词 。强制
库名、表名的命名库名尽量与应用名称一致,表名最好用 业务名称_表的作用 命名 。强制
索引命名主键索引用 pk_字段名;唯一索引用 uk_字段名;普通索引用 idx_字段名 。强制pk_ 即 primary key;uk_即 unique key;idx_即 index
小数类型数据类型是 decimal,禁止使用 float 和 double,float 和 double 存在精度损失,如果存储的数据范围超过 decimal 的范围,建议将数据拆成整数和小数并分开存储 。强制
varchar类型varchar是可变长字符串,不预先分配存储空间,长度不要超过5000个字符,如果长度大于5000应用text(独立出一张表来,用主键来对应,避免影响其他字段的索引效率) 。强制
表名必备三字段id(数据类型是 unsigned bigint,单表递增,步长为1),gmt_create、gmt_modified(主动创建时间、被动更新时间,数据类型都是 datetime) 。强制
字段冗余字段允许适当冗余,但必须考虑数据一致,冗余字段应具备1)不频繁修改;2)不是varchar超长字段,更不能是text字段 。推荐
分库分表单表行数超过500万行或者单表容量超过2GB时,才推荐分库分表 。推荐
设置合适的字符存储长度,不但可以节约数据库表空间和索引存储,更重要的是能够提升检索速度 。
3.建索引铁律
-铁律Level备注
唯一索引业务上具有唯一特性的字段,即使是多个字段的组合,也必须建成唯一索引 。虽然唯一索引影响了 insert 速度,这个损耗可以忽略,但是明显提高了查询速度;另外,即使在应用层做了非常完善的校验控制,只要没有唯一索引,根据墨菲定律,必然有脏数据产生 。强制
join超过三个表禁止 join,需要 join 的字段,数据类型必须一致;当多表关联查询时,保证被关联的字段需要有索引;即使双表 join 也要注意表索引、SQL 性能 。强制
varchar字段上建立索引必须指定索引长度,没必要对全字段建立索引,根据实际文本区分度决定索引长度即可 。索引长度与区分度是一对矛盾体,一般对字符串类型数据,长度为 20 的索引,区分度会高达 90% 以上,可以使用 count(distinct left(列名, 索引长度))/count(*) 的区分度来确定 。强制
页面搜索禁止模糊页面搜索禁止左模糊或者全模糊,如果有需要请走搜索引擎来解决 。禁止原因:索引文件具有 B-Tree 的最左前缀匹配特性,如果左边的值未确定,那么无法使用此索引 。强制
order by如果有 order by 的场景,请注意索引的有序性 。order by 最后的字段是组合索引的一部分,并且放在索引组合顺序的最后,避免出现 file_sort 的情况,影响查询性能 。正例:where a=? and b=? order by c; 索引应建为 a_b_c;反例:索引中有范围查找,那么索引有序性无法利用,如 where a>10 order by b; 索引 a_b 无法排序 。推荐
4.写SQL铁律
-铁律Level备注
count(*)不要使用 count(列名) 或 count(常量) 来替代 count(*),count(*) 是 SQL92 定义的标准统计行数的语法,跟数据库无关,跟 NULL 和非 NULL 无关 。count(*) 会统计值为 NULL 的行,而 count(列名) 不会统计此列为 NULL 的行 。强制
count(distinct col)计算该列除 NULL 外的不重复行数 。注意,count(distinct col1, col2),如果其中一列全为 NULL,那么即使另一列有不同的值,也返回为 0 。强制
sum(col)当一列的值全为 NULL 时,count(col) 的返回结果为 0,但 sum(col) 的返回结果为 NULL,因此使用 sum() 时需要注意 NPE 问题 。可用如下方式避免 NPE 问题:select if(isnull(sum(g)), 0, sum(g)) from table;强制
isnull使用 isnull() 来判断是否为 NULL 值 。NULL 与任何值的比较都为 NULL 。强制
分页查询逻辑若 count 为 0 应直接返回,避免执行后面的分页语句 。强制


推荐阅读