MySQL存储引擎及其面向的数据库应用

jopen 12年前

    由于工作的需要笔者有很长一段时间需要与开发人员进行沟通,并在必要时展开相关的培训工作。在这个过程中,笔者发现大多数开发人员不知道MySQL的存储 引擎概念,这可能和他们以往开发的数据库应用如Microsoft SQL Server、Oracle、DB2等有关。而在MySQL数据库中,存储引擎的概念显得尤为重要,每个存储引擎可能面向一种特定或者最优的数据库应用环 境。

        图1-1显示了MySQL数据库的体系结构,可见MySQL数据库由以下几部分组成:

        ·连接池组件(Connection Pool)。

        ·管理服务和工具组件(Management Services &Utilities)。

        ·SQL接口组件(SQL Interface)。

        ·查询分析器组件(Parser)。

        ·优化器组件(Optimizer)。

        ·缓冲组件(Caches & Buffers)。

        ·插件式存储引擎(Pluggable Storage Engines)。

        ·物理文件(File system)。

MySQL存储引擎及其面向的数据库应用
图 1-1MySQL数据库的体系结构

        SQL解析器、SQL优化器、缓冲池、存储引擎等组件在每个数据库中都存在,但不是每个数据库都有这么多存储引擎。MySQL的插件式存储引擎 可以让存储引擎层的开发人员设计他们希望的存储层,例如,有的应用需要满足事务的要求,有的应用则不需要对事务有这么强的要求;有的希望数据能持久存储, 有的只希望放在内存中,临时并快速地提供对数据的查询。下面将介绍MySQL数据库中一些常用的存储引擎及它们面向的数据库应用。

        InnoDB存储引擎:

        支持事务,其设计目标主要面向联机事务处理(OLTP)的应用。其特点是行锁设计、支持外键,并支持类似Oracle的非锁定读,即默认读取操作不会产生锁。从MySQL 5.5.8版本开始是默认的存储引擎。

        InnoDB存储引擎将数据放在一个逻辑的表空间中,这个表空间就像黑盒一样由InnoDB存储引擎自身来管理。从MySQL 4.1(包括4.1)版本开始,可以将每个InnoDB存储引擎的表单独存放到一个独立的ibd文件中。此外,InnoDB存储引擎支持将裸设备(row disk)用于建立其表空间。

        InnoDB通过使用多版本并发控制(MVCC)来获得高并发性,并且实现了SQL标准的4种隔离级别,默认为REPEATABLE级别,同时 使用一种称为netx-key locking的策略来避免幻读(phantom)现象的产生。除此之外,InnoDB存储引擎还提供了插入缓冲(insert buffer)、二次写(double write)、自适应哈希索引(adaptive hash index)、预读(read ahead)等高性能和高可用的功能。

        对于表中数据的存储,InnoDB存储引擎采用了聚集(clustered)的方式,每张表都是按主键的顺序进行存储的,如果没有显式地在表定义时指定主键,InnoDB存储引擎会为每一行生成一个6字节的ROWID,并以此作为主键。

        InnoDB存储引擎是MySQL数据库最为常用的一种引擎,非死book、Google、Yahoo等公司的成功应用已经证明了 InnoDB存储引擎具备高可用性、高性能以及高可扩展性。对其底层实现的掌握和理解也需要时间和技术的积累。如果想深入了解InnoDB存储引擎的工作 原理、实现和应用,可以参考《MySQL技术内幕:InnoDB存储引擎》一书。

        MyISAM存储引擎:

        不支持事务、表锁设计、支持全文索引,主要面向一些OLAP数据库应用,在MySQL 5.5.8版本之前是默认的存储引擎(除Windows版本外)。数据库系统与文件系统一个很大的不同在于对事务的支持, MyISAM存储引擎是不支持事务的。究其根本,这也并不难理解。用户在所有的应用中是否都需要事务呢?在数据仓库中,如果没有ETL这些操作,只是简单 地通过报表查询还需要事务的支持吗?此外,MyISAM存储引擎的另一个与众不同的地方是,它的缓冲池只缓存(cache)索引文件,而不缓存数据文件, 这与大多数的数据库都不相同。

        NDB存储引擎:

        2003年,MySQL AB公司从Sony Ericsson公司收购了NDB 存储引擎。NDB存储引擎是一个集群存储引擎,类似于Oracle的RAC集群,不过与Oracle RAC的 share everything结构不同的是,其结构是share nothing的集群架构,因此能提供更高级别的高可用性。NDB存储引擎的特点是数据全部放在内存中(从5.1版本开始,可以将非索引数据放在磁盘 上),因此主键查找(primary key lookups)的速度极快,并且能够在线添加NDB数据存储节点(data node)以便线性地提高数据库性能。由此可见,NDB存储引擎是高可用、高性能、高可扩展性的数据库集群系统,其面向的也是OLTP的数据库应用类型。

        Memory存储引擎:

        正如其名,Memory存储引擎中的数据都存放在内存中,数据库重启或发生崩溃,表中的数据都将消失。它非常适合于存储OLTP数据库应用中临 时数据的临时表,也可以作为OLAP数据库应用中数据仓库的维度表。Memory存储引擎默认使用哈希索引,而不是通常熟悉的B+树索引。

        Infobright存储引擎:

        第三方的存储引擎。其特点是存储是按照列而非行的,因此非常适合OLAP的数据库应用。其项目主页是http://www.infobright.org/,上面有不少成功的数据仓库案例可供分析。

        NTSE存储引擎:

        网易公司开发的面向其内部使用的存储引擎。目前的版本不支持事务,但提供压缩、行级缓存等特性,不久的将来会实现面向内存的事务支持。

        MySQL数据库还有很多其他存储引擎,上述只是列举了最为常用的一些引擎。如果你喜欢,完全可以编写专属于自己的引擎,这就是开源赋予我们的能力,也是开源的魅力所在。