MySQL误操作后如何快速恢复数据

hearly 8年前
   <p>基本上每个跟数据库打交道的程序员(当然也可能是你同事)都会碰一个问题,MySQL误操作后如何快速回滚?比如,delete一张表,忘加限制条件,整张表没了。假如这还是线上环境核心业务数据,那这事就闹大了。误操作后,能快速回滚数据是非常重要的。</p>    <h2>传统解法</h2>    <p>用全量备份重搭实例,再利用增量binlog备份,恢复到误操作之前的状态。然后跳过误操作的SQL,再继续应用binlog。此法费时费力,不值得再推荐。</p>    <h2>利用binlog2sql快速闪回</h2>    <p>首先,确认你的MySQL server开启了binlog,设置了以下参数:</p>    <pre>  <code class="language-sql">[mysqld]  server-id = 1  log_bin = /var/log/mysql/mysql-bin.log  max_binlog_size = 1000M  binlog-format = row  </code></pre>    <p>如果没有开启binlog,也没有预先生成回滚SQL,那真的无法快速恢复数据了。对存放重要业务数据的MySQL,强烈建议开启binlog。</p>    <p>随后,安装开源工具 binlog2sql 。binlog2sql是一款简单易用的binlog解析工具,其中一个功能就是利用binlog进行闪回。</p>    <pre>  <code class="language-sql">gitclone https://github.com/danfengcao/binlog2sql.git  pipinstall -r requirements.txt  </code></pre>    <p>然后,我们就可以生成回滚SQL了。</p>    <p>背景:误删了test库tbl表整张表的数据,需要紧急回滚。</p>    <pre>  <code class="language-sql">test库tbl表原有数据  mysql> select * from tbl;  +----+--------+---------------------+  | id | name  | addtime            |  +----+--------+---------------------+  |  1 | 小赵  | 2016-12-10 00:04:33 |  |  2 | 小钱  | 2016-12-10 00:04:48 |  |  3 | 小孙  | 2016-12-10 00:04:51 |  |  4 | 小李  | 2016-12-10 00:04:56 |  +----+--------+---------------------+  4 rows in set (0.00 sec)     mysql> delete from tbl;  Query OK, 4 rows affected (0.00 sec)     tbl表被清空  mysql> select * from tbl;  Empty set (0.00 sec)  </code></pre>    <p>恢复数据步骤:</p>    <ol>     <li>登录mysql,查看目前的binlog文件 <pre>  <code class="language-sql">mysql> show master logs;  +------------------+-----------+  | Log_name        | File_size |  +------------------+-----------+  | mysql-bin.000046 |  12262268 |  | mysql-bin.000047 |      3583 |  +------------------+-----------+  </code></pre> </li>     <li>最新的binlog文件是mysql-bin.000047,我们再定位误操作SQL的binlog位置 <pre>  <code class="language-sql">$ python binlog2sql/binlog2sql.py -h127.0.0.1 -P3306 -uadmin -p'admin' -dtest -ttbl --start-file='mysql-bin.000047'  输出:  DELETE FROM `test`.`tbl` WHERE `addtime`='2016-12-10 00:04:33' AND `id`=1 AND `name`='小赵' LIMIT 1; #start 3346 end 3556  DELETE FROM `test`.`tbl` WHERE `addtime`='2016-12-10 00:04:48' AND `id`=2 AND `name`='小钱' LIMIT 1; #start 3346 end 3556  DELETE FROM `test`.`tbl` WHERE `addtime`='2016-12-10 00:04:51' AND `id`=3 AND `name`='小孙' LIMIT 1; #start 3346 end 3556  DELETE FROM `test`.`tbl` WHERE `addtime`='2016-12-10 00:04:56' AND `id`=4 AND `name`='小李' LIMIT 1; #start 3346 end 3556  </code></pre> </li>     <li>生成回滚sql,并检查回滚sql是否正确 <pre>  <code class="language-sql">$ python binlog2sql/binlog2sql.py -h127.0.0.1 -P3306 -uadmin -p'admin' -dtest -ttbl --start-file='mysql-bin.000047' --start-pos=3346 --end-pos=3556 -B  输出:  INSERT INTO `test`.`tbl`(`addtime`, `id`, `name`) VALUES ('2016-12-10 00:04:56', 4, '小李'); #start 3346 end 3556  INSERT INTO `test`.`tbl`(`addtime`, `id`, `name`) VALUES ('2016-12-10 00:04:51', 3, '小孙'); #start 3346 end 3556  INSERT INTO `test`.`tbl`(`addtime`, `id`, `name`) VALUES ('2016-12-10 00:04:48', 2, '小钱'); #start 3346 end 3556  INSERT INTO `test`.`tbl`(`addtime`, `id`, `name`) VALUES ('2016-12-10 00:04:33', 1, '小赵'); #start 3346 end 3556  </code></pre> </li>     <li>确认回滚sql正确,执行回滚语句。登录mysql确认,数据回滚成功。 <pre>  <code class="language-sql">$ python binlog2sql.py -h127.0.0.1 -P3306 -uadmin -p'admin' -dtest -ttbl --start-file='mysql-bin.000047' --start-pos=3346 --end-pos=3556 -B | mysql -h127.0.0.1 -P3306 -uadmin -p'admin'     mysql> select * from tbl;  +----+--------+---------------------+  | id | name  | addtime            |  +----+--------+---------------------+  |  1 | 小赵  | 2016-12-10 00:04:33 |  |  2 | 小钱  | 2016-12-10 00:04:48 |  |  3 | 小孙  | 2016-12-10 00:04:51 |  |  4 | 小李  | 2016-12-10 00:04:56 |  +----+--------+---------------------+  </code></pre> </li>    </ol>    <p>至此,不用再担心被炒鱿鱼了。</p>    <h2>常见问题</h2>    <ul>     <li>有人会问,我DDL误操作了怎么快速回滚?比如drop了一张大表。 <p>很难做到。因为即使在在row模式下,DDL操作也不会把每行数据的变化记录到binlog,所以DDL无法通过binlog回滚。实现DDL回滚,必须要在执行DDL前先备份老数据。确实有人通过修改mysql server源码实现了DDL的快速回滚,我找到阿里的xiaobin lin提交了一个patch。但据我所知,国内很少有互联网公司应用了这个特性。原因的话,我认为最主要还是懒的去折腾,没必要搞这个低频功能,次要原因是会增加一些额外存储。</p> <p>所以,DDL误操作的话一般只能通过备份来恢复。如果公司连备份也不能用了,那真的建议去买张飞机票了。干啥?跑呗</p> </li>     <li>mysql除了 binlog2sql ,是否还有其他回滚工具? <p>当然有。阿里彭立勋对mysqlbinlog增加了flashback的特性,这应该是mysql最早有的flashback功能,彭解决的是DML的回滚,并说明了利用binlog进行DML闪回的设计思路。DDL回滚特性也是由阿里团队提出并实现的。 这两个功能是有创新精神的,此后出现的闪回工具基本都是对上面两者的模仿 。另外,去哪儿开源的Inception是一套MySQL自动化运维工具,这个就比较重了,支持DML回滚,还不是从binlog回滚的,是从备份回滚的,也支持DDL回滚表结构,数据是回滚不了滴~ 还有一种做法叫slave延时备份,搞台不加业务流量的slave,故意延迟一段时间,这其实是在传统办法的基础上去除了实例恢复这步。此法会额外消耗一台机器,我们不推荐这么做。</p> </li>    </ul>    <p>如有mysql回滚相关的优秀工具优秀文章遗漏,烦请告知~</p>    <p>我的邮箱 danfengcao.info@gmail.com</p>    <h2>参考资料</h2>    <p>[1] 彭立勋, <a href="/misc/goto?guid=4959729108910902401" rel="nofollow,noindex">MySQL下实现闪回的设计思路</a></p>    <p>[2] Lixun Peng, <a href="/misc/goto?guid=4959729108990097859" rel="nofollow,noindex">Provide the flashback feature by binlog</a></p>    <p>[3] 丁奇, <a href="/misc/goto?guid=4959729109075416476" rel="nofollow,noindex">MySQL闪回方案讨论及实现</a></p>    <p>[4] xiaobin lin, <a href="/misc/goto?guid=4959729109157687685" rel="nofollow,noindex">flashback from binlog for MySQL</a></p>    <p>[5] 王竹峰, <a href="/misc/goto?guid=4959729109239214611" rel="nofollow,noindex">去哪儿inception</a></p>    <p>[6] danfengcao, <a href="/misc/goto?guid=4959729109314792293" rel="nofollow,noindex">binlog2sql: Parse MySQL binlog to SQL you want</a></p>    <p> </p>    <p>来自:http://blog.jobbole.com/108809/</p>    <p> </p>