问题背景
在停服发版更新时,需对 200gb 大表(约 200 亿行数据)进行快速备份以预防操作失误。
因为曾经出现过有开发写的发版语句里,update
语句的where
条件写错了,原本只需要更新几行数据,最终导致更新了半张表的数据。
mysql版本是mysql 8.0.x,为了预防这种情况,需要对某个重要的大表进行预先备份,以便可以及时回滚,及时恢复,及时回退,对于备份方法大概有下面几种:
方案 | 优点 | 缺点 |
---|---|---|
mysqldump 导出 | 简单易用 | 大表导出耗时(200gb 可能需数小时) |
create table...select | 直接 sql 操作 | 数据复制慢,锁表风险高 |
表空间传输 | 秒级备份,零数据复制 | 需操作系统权限,依赖文件拷贝 |
主从复制/延迟复制 | 无需停服,恢复灵活 | 需主从架构,维护成本高 |
这个场景的核心需求:停服更新的时间非常有限,比如1个小时之内要完成更新。
操作流程
前面两种都比较简单,通过导数据的方法来备份旧表,万一出现问题,可以使用导出来的数据进行快速恢复,第三种方法估计比较少人用,下面是具体操作方法
- 源表与备胎表结构
-- 源表(aa) create table aa ( id int(11) default null, sname varchar(100) ) engine=innodb; -- 备胎表(bb) create table bb ( id int(11) default null, sname varchar(100) ) engine=innodb; greatsql> insert into aa select 1,"nihao";
2、备胎表卸载表空间:
greatsql> alter table bb discard tablespace; -- 加锁并生成配置文件
3、源表执行表空间导出:
greatsql> use school; greatsql> flush tables aa for export;
4、拷贝表空间文件(ibd和cfg文件),然后重新赋予权限,确保导入表空间时候不会出现问题
$ cd /data/mysql/mysql3306/data/school $ cp aa.ibd bb.ibd $ cp aa.cfg bb.cfg $ chown -r mysql:mysql /data/mysql/mysql3306/data/*
5、在相同数据库下,备胎表和源表都导入表空间
greatsql> use school; greatsql> unlock tables; greatsql> alter table bb import tablespace; greatsql> alter table aa import tablespace;
6、查询表数据,验证数据一致性
greatsql> use school; greatsql> select * from bb; greatsql> select * from aa;
查询表数据正常,没有任何问题
greatsql> select * from aa; +------+-------+ | id | sname | +------+-------+ | 1 | nihao | +------+-------+ 1 row in set (0.01 sec) greatsql> select * from bb; +------+-------+ | id | sname | +------+-------+ | 1 | nihao | +------+-------+ 1 row in set (0.00 sec)
查看表的数据文件,没什么问题
$ ll total 228 -rw-r----- 1 mysql mysql 114688 mar 4 16:51 aa.ibd -rw-r----- 1 mysql mysql 781 mar 4 16:52 bb.cfg -rw-r----- 1 mysql mysql 114688 mar 4 16:52 bb.ibd
7、发版更新与回滚
-- 发版操作(示例) greatsql> update aa set sname = 'new_value' where id > 1;
8、如果发版有问题,直接交换表名,最快速度恢复整个表的数据
-- 回滚操作(交换表名) greatsql> alter table aa rename to aa_temp; greatsql> alter table bb rename to aa;
总结
整个操作最重要的是第4步,操作系统级别的拷贝就完成了整个表的备份,相比于数据倒来倒去在速度上要快不少。另外,第5步的备胎表也可以不用导入,只有当发现发版出现问题时候,再导入也可以。
这种方法的关键优势如下
- 直接拷贝 .ibd 文件,无需逐行复制数据。
- 零锁表时间:
flush tables tablename for export
仅短暂加锁(秒级)。 - 快速恢复:通过表名交换实现秒级回滚。
特别适合于这几种场景:无主从架构的单实例环境、大表快速备份、停服时间敏感。
当然,如果有主从架构的话,则更加推荐使用第四种方法,在操作上也更加可控,短时间也能保证能够完成。
关于 greatsql
greatsql是适用于金融级应用的国内自主开源数据库,具备高性能、高可靠、高易用性、高安全等多个核心特性,可以作为mysql或percona server的可选替换,用于线上生产环境,且完全免费并兼容mysql或percona server。
到此这篇关于mysql下200gb大表备份,利用传输表空间解决停服发版表备份问题的文章就介绍到这了,更多相关使用java代码获取jvm信息内容请搜索代码网以前的文章或继续浏览下面的相关文章希望大家以后多多支持代码网!
发表评论