SQL优化

jopen 12年前

做了很多年有关数据库的开发工作,现在把我对sql优化的一些经验分享下。(由于我主要使用mysql,对其它结构化数据库不太熟悉,所以可能具有片面性,欢迎拍砖)

sql优化的方面:

           1、设计好的数据库结构

           2、分表与分区

           3、创建正确的索引

           4、减少访问的次数

           5、减少不必要的返回数据

           6、书写高效的sql

 

1、设计好的数据库结构

          好的数据库结构不同的业务有不同的看法,这里主要说一条,好的数据库设计应高保留重构的可能性。

2、分表与分区

          (1)、分表

                   分表就是将一张大表分成多张小表。

                   分表的作用是提高数据库的读写性能。

          (2)、分区

                   分区是将一张表分成多个区块。多个区块可以在不同磁盘上。

                   分区的作用是提高磁盘的读写性能。

3、创建正确的索引

           要创建正确的索引,有几点是值得注意的:

                    (1)、根据业务中调用频繁的sql的where语句建立索引。

                    (2)、索引的列的大小会对影响性能

                    (3)、联合索引中索引列的顺序是很关键的

                    (4)、索引并不是越多越好

4、减少访问的次数

            如果你需要对1000条数据进行处理,可能的情况下当然是一次取出来再处理,而不是取一条处理一条。减少了访问次数也就减少了磁盘I/O,在很多应用里面,磁盘I/O都是性能的瓶颈。

5、减少不必要的返回数据

            减少不必要的返回数据既指返回数据的条数,也指返回的数据字段。减少不必要的返回数据也就减少了网络传输时间和磁盘I/O。

6、书写高效的sql

            (1)、尽量不要使用IS NULL或者IS NOT NULL

                       因为索引是不索引空的,因此他们将不使用索引。

            (2)、尽量不要使用NOT

                       NOT也是不能使用索引的。

            (3)、用EXISTS替代IN、用NOT EXISTS替代NOT IN

                       IN 是把外表和内表作hash连接,而EXISTS是对外表作loop循环,每次loop循环再对内表进行查询。因此使用EXISTS的时候不要忘了在子查询中加上外表字段与子表字段的联合条件,否则效率同样会很低。IN与EXISTS同样与两张表的数据量有一定的关系。

                       NOT EXISTS使用全表扫描,效率很低。

            (4)、LIKE操作符

                       尽量不要使用'%www'的这种通配符前置的查询,因为不会使用索引。

            (5)、用UNION ALL 替代 UNION

                       UNION需要排序删除重复,UNION ALL仅仅合并。

            (6)、尽量少用OR

            (7)、WHERE后面条件的顺序

                        前面的条件尽量减少数据,还有顺序也与索引有关。虽然新的数据库引擎会做一些优化,但是同样可以减少引擎优化的时间。