1、整体思路

针对业务系统的出现的慢sql 我们的优化步骤大概分为以下几步

1、识别高负载语句

2、收集性能相关的数据

3、确定性能问题产生的原因

4、实施优化手段

下面我们针对这几个步骤展开进行讲解

1、识别高负载语句

金仓数据库 kingbase ES针对满语句识别有以下几个工具

• sys_stat_statements

需要闯将sys_stat_statements 扩展，默认金仓数据库已经创建对应扩展

通过sys_stat_statements 查看数据库sql语句执行情况，发现有问题语句并进行优化

该视图可以查询内容包括

1、语句内容

2、语句执行次数

3、语句解析次数和时间

3、shared_buffer 使用情况是否用到了磁盘read 还是用到了 shared _buffer hit

4、temp_buffer ，work_me,maintance_men 命中情况通过local字段排查

• kbbadger

kbbadger 是金仓提供的一款日志分析工具，通过该工具可以胜场html格式的sql执行情况分析报告。

生成要求和指令如下：

• KWR报告

KWR 报告需要借助于快照生成，由于快照时间间隔默认是1小时，所以实时性比较弱，但是在分析性能问题时建议首先收集一次KWR这样可以对数据库整体负载有一个全面的了解。

KWR的创建方法如下：

创建扩展

Create extension sys_kwr;

建议配置参数修改之后reload 即可，无需重启数据库

track_sql = on

track_instance = on -- KWR 1.3 新增参数

track_wait_timing = on -- 默认开启

track_counts = on --默认开启

track_io_timing = on

track_functions = 'all'

sys_stat_statements.track = 'top'

生成快照

CREATE EXTENSION sys_kwr;

SELECT * FROM perf.create_snapshot(); -- 获得快照 1

CREATE TABLE IF NOT EXISTS t1(id int); -- 创建一个示例表

SELECT count(*) FROM t1; -- 执行一些 SQL

SELECT * FROM perf.create_snapshot(); -- 获得快照 2

SELECT * FROM perf.kwr_report(1,2); -- 生成 TEXT 版本报告

SELECT * FROM perf.kwr_report(1,2, 'html'); -- 生成 HTML 版报告

• KSH报告

sys_ksh 以每秒采样的方式进行会话和数据收集，并将采集数据放入内存的 Ringbuf 队列中对资源消耗大建议采用临时开启方式。

旧版本需要单独安装sys_ksh扩展，新版本已经集成到sys_kwr 中

V8R6B24版本使用方法

Create extension sys_kwr;

sys_kwr.collect_ksh 设置 ksh=on 需要reload不需要重启

alter system set sys_kwr.collect_ksh =off

保存于内存 Ringbuf 的数据可以通过视图 perf.session_history 查看：

SELECT * FROM perf.session_history;

其中保存于数据库的历史数据可以通过视图 perf.ksh_history 查看：

SELECT * FROM perf.ksh_history;

生成的报告可以通过 perf.ksh_report 查看：

SELECT perf.ksh_report(start_ts, duration, slot_width, write_to_file);

参数说明：

• start_ts: 报告开始时间，默认：当前时间-15 分钟

• duration: 报告时长，默认到 15 分钟，最大不超过 60 •

slot_width: 报告最小区间，输入 0 时系统自动计算合适的宽度

• write_to_ffle: 是否输出到 sys_log 目录，默认否

KSH 输出报告的内容章节包括：

• Report & Instance Info: 报告和实例信息

• Top User Event: TOP 用户事件

• Top Background Event: TOP 后端事件

• Top SQL with Top Event: TOP 语句的 TOP 事件

• Complete List Of SQL Text: TOP 完整语句

• Top Session: TOP 会话

• Top Client Id: TOP 客户端

• Top SQL Command Type: TOP 语句命令类型

• Top Phase Of Execution: TOP 运行阶段

• Activity Over Time: 区间活动统计实例运行效果如下：

2、收集性能相关的数据

其实在高负载sql识别时已经收集了一部分性能相关数据。在sql调优过程中还是以sql执行计划为主，但为了判断执行计划的准确性以及可能存在的其他性能问题还需要收集一些其他信息。

首先要了解相关表的结构和数据量和分布情况

select id,count(1) from t01 group by id; -- 查看某一个字段或者条件数据分布情况

select sys_relation_size('t01'); --查看表的大小

select count(1) from t01; --统计实际行数

然后收集执行计划

explain (analyze true,buffers true) select * from t01; -- select语句可以使用analyze

explain (buffers true) updatae -- update语句不建议使用analyze

绑定变量方式收集执行计划

prepare a as select * from t01 where id=$1;

explain analyze execute a('1');"

sql执行情况分析

查看解析情况

select a.userid, b.usename, dbid, queryid, query, parses, max_parse_time, mean_parse_time from sys_stat_statements a ,sys_user b WHERE a.""userid"" = b.usesysid and b.usename='system';

查看内存命中情况

select a.userid, b.usename, dbid, queryid, query, shared_blks_hit ""缓存读"", shared_blks_read ""IO读"" from sys_stat_statements a ,sys_user b WHERE a.""userid"" = b.usesysid;

查看等待事件 select a.usesysid, b.usename , wait_event_type,wait_event,state from sys_stat_activity a,sys_user b,sys_stat_statements c WHERE a.usesysid = b.usesysid AND a.query=c.""query"" and b.usename='system' AND c.""queryid"" ='';

查看是否有锁通过查询sys_locks "