MySQL 性能分析

影响数据库性能的因素

1、SQL查询速度（mysql不支持多CPU并发运算，每个SQL只能用到一个CPU

QPS:每秒钟处理的查询量（同时处理SQL的数量）

TPS:每秒钟处理的事务数

2、 服务器硬件

并发量：同一时刻，对数据库服务器请求的数量。

连接量：同一时刻，与数据库服务器的连接数（mysql config里的max_connection决定，默认为100），一般会造成超过此数量的用户无法连接数据库，造成错误500。

3、 网卡流量

风险：网卡IO会被占满（千兆网卡=1000Mb/8 约=100MB）

解决办法：

减少从服务器的数量（从服务器从主服务器中复制日志，造成网络流量变大）  

进行分级缓存（避免前端Web服务器突然一下子缓存太多）  

避免使用“ select  * ”进行查询  

分离业务网络和服务器网络

4、 磁盘IO

风险：

磁盘IO性能突然下降，解决办法（使用更快的磁盘设备）。  

其他大量消耗磁盘性能的计划任务（调整计划任务，做好磁盘维护）  

5、大表

特点：

记录行数巨大，单表超过1000W行  

表数据文件巨大，超过10G

大表对查询的影响：

慢查询：超过指定时间的SQL语句查询

慢查询分析语句：EXPLAIN SELECT语句

举个例子：

# 查看慢查询的时间，假如查询超过3s，就是慢查询
mysql> show variables like "long%";
+-----------------+----------+
| Variable_name   | Value    |
+-----------------+----------+
| long_query_time | 3.000000 |
+-----------------+----------+
1 row in set (0.02 sec)

# 这是用来举例子的表
mysql> desc device_operation_sendrecord;
+-------------+-------------+------+-----+---------+----------------+
| Field       | Type        | Null | Key | Default | Extra          |
+-------------+-------------+------+-----+---------+----------------+
| create_time | datetime(6) | NO   |     | NULL    |                |
| modify_time | datetime(6) | NO   |     | NULL    |                |
| send_id     | int(11)     | NO   | PRI | NULL    | auto_increment |
| send_time   | datetime(6) | NO   |     | NULL    |                |
| send_status | varchar(10) | NO   |     | NULL    |                |
| device_id   | int(11)     | YES  | MUL | NULL    |                |
+-------------+-------------+------+-----+---------+----------------+
6 rows in set (0.88 sec)

# 慢查询的例子：
mysql> explain select * from device_operation_sendrecord where send_status like '%s%'\G;
*************************** 1. row ***************************
           id: 1
  select_type: SIMPLE
        table: device_operation_sendrecord
         type: ALL                              # 检索方式：ALL 表示全表扫描，通常ALL不好
possible_keys: NULL                             # 显示可能应用在这张表的索引（但可能没有使用索引）
          key: NULL                             # 实际使用的索引，若为NULL，则表示没有使用索引
      key_len: NULL                             # 索引长度
          ref: NULL
         rows: 403                              # sql语句扫描的长度
        Extra: Using where                      # sql语句额外开销
1 row in set (0.04 sec)

# 使用了索引主键查询
mysql> explain select * from device_operation_sendrecord where send_id = 6\G;
*************************** 1. row ***************************
           id: 1
  select_type: SIMPLE
        table: device_operation_sendrecord
         type: const
possible_keys: PRIMARY
          key: PRIMARY
      key_len: 4
          ref: const
         rows: 1
        Extra: NULL
1 row in set (0.03 sec)

主要字段详解

select_type：SIMPLE / PRIMARY / SUBQUERY / DERIVED …

作用：主要用于区分不同子查询，SIMPLE表示不含子查询

type：ALL / index / range / ref / eq_ref / const, system /NULL

访问类型：获取数据的方式，从左到右，性能由差到好

ALL：Full Table Scan，遍历全表
index：Full Index Scan，遍历索引树
range：索引范围扫描，返回匹配值域的行，常见于between/in等
ref：非唯一性索引扫描，返回匹配某个单独值的所有行，常见于前缀索引查询
eq_ref：唯一性索引扫描，对于每个索引键，表中只有一条记录与之匹配

possible_keys：候选索引

key：实际使用的索引

ref：连接匹配条件，即哪些列或常量被用于查找索引列上的值

rows：MySQL根据表统计信息及索引选用情况，估算的找到所需的记录所需要读取的行数

Extra：不适合在前面列中显示，但十分重要的额外信息

- Using index：表示相应的select操作中使用了覆盖索引   
- Using where：表示服务器从存储引擎收到记录后进行“后过滤”（Post-filter）
- Using temporary：表示MySQL需要使用临时表来存储结果集，常见于排序和分组查询
- Using filesort：表示MySQL中无法利用索引完成的排序操作，称为“文件排序”

慢查询工具：

hook，在服务端sql语句执行前触发hook（explain select）  

对queryset进行分析，检出有可能产生慢查询的sql语句  

向RD、QA自动发送慢查询报警邮件

大表对DDL操作的影响：

建立索引需要很长时间。  

修改表结构需要长时间锁表，造成主从延迟，影响正常数据库操作。

解决大表问题：

分库分表：

难点：

分库主键的选择  

分表后跨分区数据的查询和操作

大表历史数据归档：

减少前后端业务的影响

难点：

归档时间点选择  

如何进行归档操作

为什么要分表？分库分表有哪几种形式？优势和劣势分别是什么？此处敲黑板

分表的原因
1. 数据库的有状态性，不那么容易扩展
2. 海量数据和高并发业务下的单机限制，如存储容量、连接数、单机读/写处理能力等
3. DBA规范性要求，单表1KW行以内
分库分表的方案
- 垂直拆分
  - 拆库，按业务数据模型，微服务
  - 拆表，大表拆成小表
  - 具体业务具体划分
- 水平拆分
  - 库内分表
  - 分库分表
分库分表的常用算法
- 取模法 f(uid) = uid % N
- 步长法 f(uid) = uid / N
- 分段取模
- 分组分段
- 白名单 + 分段取模
- 动态平衡 + 路由表
分库分表算法优劣对比

算法	数据均衡性	访问均衡性	VIP风险	配置维护成本	例行扩容成本	边际扩容成本
取模	优	优	有	低	无	高
步长	中	中	有	低	有	低
分段取模	良	良	有	中	有	低
分组分段	优	优	有	高	有	低
白名单	-	-	无	-	-	-
动态平衡	良	优	无	高	无	低

6、 大事务

大事务：运行时间比较长，操作数据比较多

事务开启：BEGIN;

事务关闭：COMMIT;

事务的概念：

事务是数据库系统区别于其他一切文件系统的重要特性之一。  

事务是一组具有原子性的SQL语句，或是一个独立的工作单元。  

特点：原子性、一致性、隔离性和持久性（ACID）

脏读：脏读就是指当一个事务正在访问数据，并且对数据进行了修改，而这种修改还没有提交到数据库中，这时，另外一个事务也访问这个数据，然后使用了这个数据。（未提交读）

不可重复读：是指在一个事务内，多次读同一数据。在这个事务还没有结束时，另外一个事务也访问该同一数据。那么，在第一个事务中的两次读数据之间，由于第二个事务的修改，那么第一个事务两次读到的的数据可能是不一样的。这样就发生了在一个事务内两次读到的数据是不一样的，（不可重复读）

幻读：是指当事务不是独立执行时发生的一种现象，例如第一个事务对一个表中的数据进行了修改，这种修改涉及到表中的全部数据行。同时，第二个事务也修改这个表中的数据，这种修改是向表中插入一行新数据。那么，以后就会发生操作第一个事务的用户发现表中还有没有修改的数据行，就好象发生了幻觉一样。

大事务的风险：

锁定太多数据，造成大量阻塞和锁超时  

回滚需要的时间比较长  

执行时间长，容易造成主从延时  

处理大事务：

避免一次处理太多数据（分批次处理）  

移出不必要的事务中的SELECT操作

MySQL 性能分析

MySQL 性能分析

影响数据库性能的因素

主要字段详解

You may also enjoy...

DB Started