SQL执行计划之sql_trace

jopen 10年前

一，sql_trace的作用：用以描述SQL的执行过程的trace输出。

- SQL是如何操作数据的

- SQL执行过程中产生了哪些等待事件

- SQL执行中消耗了多少资源

- SQL的实际执行计划

- SQL产生的递归语句

二，set autotrace 与 sql_trace的区别

set autotrace用于输出优化器产生的执行计划，执行计划展示的资源消耗情况是CBO的估算值，并不一定是SQL实际执行时资源消耗情况。比如，向表t 中插入10万条数据，执行查询的时候发现只返回少量数据，这可能就是表t还没有被Oracle重分析，它并不知道表的数据已更新。

sql_trace是SQL实际的执行情况。

三，何时使用set autotrace 与 sql_trace

当需要分析执行计划及CBO行为时，使用set autotrace；当要看一条SQL的真实运行效果时，使用sql_trace。

四，sql_trace的使用

（1）收集本回话的SQL执行过程

SQL>alter session set sql_trace=true

SQL>alter session set statistics_level = all;

SQL>alter session set timed_statistics = true;

SQL>alter session set max_dump_file_size = unlimited;

SQL>alter session set tracefile_identifier = liangjian

SQL>sql.....

SQL>alter session set sql_trace=false

SQL>exit

（2）收集其它会话的SQL执行过程

SQL1>select sid, serial# from v$session;

SQL2>execute dbms_system.set_sql_trace_in_session(sid, serial#, true);

SQL2>sql....

SQL2>execute dbms_system.set_sql_trace_in_session(sid, serial#, false);

五，trace文件内容

生成的trace文件的目录由参数文件指定，可以通过v$diag_info视图来查看，name=Default Trace File的值就是trace文件的默认路径。下面是一个实际生成的trace文件：

SQL执行计划之sql_trace

trace文件内容：

SQL执行计划之sql_trace

trace文件中记录的是Oracle按照时间先后顺序来输出的，它是Oracle执行SQL最底层的过程。上面第二个红色方框中体现的就是我们所发出SQL执行的过程，其意思是：首先打开一个标号为4的游标，关联这条SQL语句，然后解析这条SQL语句（PARSE #4），其中mis=1表示共享区中没有可共享已解析SQL，故它执行的是一次硬解析，然后执行SQL语句，再然后获取数据，最后关闭游标。有时候游标标号相同的输出并不在一起，因为trace文件是按照时间的先后顺序输出的，这也最能反映Oracle内部的执行顺序。

trace文件中有很多键值对信息，初次看trace文件也一定是看不懂的，下面介绍一下各个键所代表的含义：

SQL执行计划之sql_trace

六，tkprof格式化工具

trace文件并不直观，为了让读者一目了然，Oracle提供了格式化trace文件的工具：tkprof

（1）tkprof命令

Usage: tkprof tracefile outputfile [explain= ] [table= ] [print= ] [insert= ] [sys= ] [sort= ]

参数说明

tracefile：你要分析的trace文件的绝对路径

outputfile：格式化后的文件绝对路径

explain=user/password@connectstring，对每条SQL 语句确定其执行规划，并将执行规划写到输出文件中。如果不是有explain，在trace文件中我们看到的是SQL实际的执行路径，不会有sql的执行计划（可以对比实际执行规划和执行计划的差别）

table=schema.tablename，在输出到输出文件前，用于存放临时表的用户名和表名。

PRINT:只列出输出文件的最初N个SQL语句。默认为所有的SQL语句。

AGGREGATE:如果= NO，则不对多个相同的SQL进行汇总。如果为yes则对trace文件中的相同sql进行合并。

INSERT:SQL 语句的一种，用于将跟踪文件的统计信息存储到数据库中。在TKPROF创建脚本后，在将结果输入到数据库中。

SYS:如果设置为yes，则所有sys用户的操作(也包含用户sql语句引发的递归sql)，这样可以减少分析出来的文件的复杂度，便于查看。

sort:对trace文件的sql语句根据需要排序，其中比较有用的一个排序选项是fchela，即按照elapsed time fetching来对分析的结果排序（记住要设置初始化参数timed_statistics=true），生成的文件将把最消耗时间的sql放在最前面显示。

SQL执行计划之sql_trace

执行计划分为两部分，第一部分称为行源操作(Row Source Operation )，是游标关闭且开启跟踪情况下写到跟踪文件中的执行计划。这意味着如果应用程序不关闭游标而重用它们的话，不会有新的针对重用游标的执行计划写入到跟踪文件中。第二部分，叫做执行计划 (Execution Plan)，是由指定了explain参数的TKPROF生成的。既然这是随后生成的，所以和第一部分不一定完全匹配。万一看到两者不一致，前者是正确的。两个执行计划都通过Rows列提供执行计划中每个操作返回的行数（不是处理的--要注意）。对于每个行源操作来说，可能还会提供如下的运行时统计：

cr是一致性模式下逻辑读出的数据块数。

pr是从磁盘物理读出的数据块数。

pw是物理写入磁盘的数据块数。

time是以微秒表示的总的消逝时间。要注意根据统计得到的值不总是精确的。实际上，为了减少开销，可能用了采样。

cost是操作的评估开销。这个值只有在Oracle 11g才提供。

size是操作返回的预估数据量(字节数)。这个值只有在Oracle 11g才提供。

card是操作返回的预估行数。这个值只有在Oracle 11g才提供。

输出文件的结尾给出了所有关于跟踪文件的信息。首先可以看到跟踪文件名称、版本号、用于这个分析所使用的参数sort的值。然后，给出了所有会话数量与SQL语句数量。

Optimizer mode: ALL_ROWS表示优化器采用的是all_rows的模式

Parsing user id: 55 表示用户id为55

（2）格式化后输出文件的解释

首先解释输出文件中列的含义：

CALL：每次SQL语句的处理都分成三个部分

Parse：这步将SQL语句转换成执行计划，包括检查是否有正确的授权和所需要用到的表、列以及其他引用到的对象是否存在。

Execute：这步是真正的由Oracle来执行语句。对于insert、update、delete操作，这步会修改数据，对于select操作，这步就只是确定选择的记录。

Fetch：返回查询语句中所获得的记录，这步只有select语句会被执行。

COUNT:这个语句被parse、execute、fetch的次数。

CPU：这个语句对于所有的parse、execute、fetch所消耗的cpu的时间，以秒为单位。

ELAPSED：这个语句所有消耗在parse、execute、fetch的总的时间。

DISK：从磁盘上的数据文件中物理读取的块的数量。

QUERY：在一致性读模式下，所有parse、execute、fetch所获得的buffer的数量。一致性模式的buffer是用于给一个长时间运行的事务提供一个一致性读的快照，缓存实际上在头部存储了状态。

CURRENT：在current模式下所获得的buffer的数量。一般在current模式下执行insert、update、 delete操作都会获取buffer。在current模式下如果在高速缓存区发现有新的缓存足够给当前的事务使用，则这些buffer都会被读入了缓存区中。

ROWS: 所有SQL语句返回的记录数目，但是不包括子查询中返回的记录数目。对于select语句，返回记录是在fetch这步，对于insert、update、delete操作，返回记录则是在execute这步。

（3）trace文件中的性能分析

1、如果分析数与执行数之比为1，说明每次执行这个查询都要进行sql解析。如果分析数与执行数之比接近0，则意味着查询执行了很多次软解析，降低了系统的可伸缩性。

2、如果trace文件中显示对所有或者几乎所有的sql都执行一次，那有可能是因为没有正确使用绑定变量。

3、如果一个(Fetch Count)/所获得行数的比值接近1，且行数大于1，则应用程序不执行大批量取数操作，每种语言/API都有能力完成这个功能，即一次取多行。如果没有利用这个功能进行批量去，将有可能花费多得多的时间在客户端与服务器端之间来回往返。这个过多的来回转换出了产生很拥挤的网络状况之外，也会比一次调用获得很多行要慢得多，如何指示应用程序进行批量获取将随语言/API而定。

4、如果CPU时间与elasped时间有巨大差异，意味着有可能花了大量时间在等待某些事情上。如果花了一个CPU时间来执行，但它却总共花了10秒的时间，这就意味着90%的运行时间在等待一个资源。例如被一个会话等待，或者大量查询时的物理IO等待等

5、较长的CPU或经过时间往往是最消耗资源的sql，需要我们关注

6、可以通过磁盘IO所占逻辑IO的比例，disk/query+current来判断磁盘IO的情况，太大的话有可能是db_buffer_size过小，当然这也跟SQL的具体特性有关

7、query+current/rows 平均每行所需的block数，太大的话（超过20）SQL语句效率太低，数据过于分散，可以考虑重组对象

转载请注明出处： http://www.cnblogs.com/pengineer/p/4610390.html

SQL执行计划之sql_trace

一，sql_trace的作用：用以描述SQL的执行过程的trace输出。

相关经验

目录