精通PostgreSQL:第40讲 - 数据库不完全恢复的全面解析

发表时间: 2024-01-04 16:16


PostgreSQL从小白到专家,是从入门逐渐能力提升的一个系列教程,内容包括对PG基础的认知、包括安装使用、包括角色权限、包括维护管理、、等内容,希望对热爱PG、学习PG的同学们有帮助,欢迎持续关注CUUG PG技术大讲堂。


第40讲:数据库不完全恢复


PostgreSQL第40讲:1月6日(周六)19:30,钉钉群(35822460)& 视频号(数据库老陈)直播

内容1:描述不完全恢复步骤

内容2:时间点恢复工作原理

内容3:执行一个不完全恢复


不完全恢复应用场景

由于归档日志丢失,完全恢复失败。

所有未归档的wal日志文件都将丢失。

用户错误

一张重要的表被删除。

表中无效的数据被提交。


时间点恢复如何工作

时间点恢复

假设你在2020年4月28日12:05犯了一个错误。您应该删除数据库群集,并使用之前所做的基本备份还原新的数据库群集。然后恢复到12:04:59,停止在错误发生之前。

PITR恢复起始点定位

PITR恢复过程重要的两个因素:

1、从哪里读取WAL段/归档日志?

PITR mode–来自配置参数archive_command中设置的存档目录。

2、从哪里读取检查点位置?

PITR模式–来自备份标签文件。


时间点恢复图示

Recover the database at 12:15:00 along the timelineId 2

不完全恢复类型

recovery_target = 'immediate' 这个参数指定恢复应该在达到一个一致状态后尽快结束。在从一个在线备份中恢复时,这意味着备份结束后的那个点。

recovery_target_name (string) 指定pg_create_restore_point()所创建的已命名的恢复点,进行恢复。

recovery_target_time (timestamp) 指定需要恢复到的时间点。

recovery_target_xid (string) 指定按事务 ID进行恢复。

recovery_target_lsn (pg_lsn) 指定按预写日志位置的LSN进行恢复。


不完全恢复指导方针

仔细遵循所有步骤:

在恢复前后进行整个数据库备份。

始终验证恢复是否成功。

备份和删除归档日志。


不完全恢复和日志

恢复前后检查数据库日志

包含错误信息、提示和txid


执行不完全恢复流程

关闭并备份数据库。

还原备份的所有数据文件。

设置需要恢复到的时间点,或者某个位置。

生成recovery.signal文件。

执行数据库启动。

把数据库变成读写模式

对全库做个冷备。


基于时间点恢复案例

当前情况:

目前的时间是2022年3月9日中午12点。

EMPLOYEES表已被删除。

表在上午11点45分左右被删除。

数据库活动最小,因为大多数工作人员目前正在开会,意味着从11点45分以后发生的数据更改很少,丢失的数据也会少,因为这一段的数据在做不完全恢复时会丢失。

必须恢复该表。


执行一个基于时间点的恢复

1、还原备份的所有数据文件

tar -vxf /backup/base.tar -C $PGDATA

2、修改postgresql.conf文件

restore_command = 'cp /home/postgres/archive/%f %p'recovery_target_time = '2022-03-09 11:44:59'

3、在$PGDATA目录下生成recovery.signal文件

touch recovery.signal

4、执行数据库启动。

pg_ctl start

5、执行函数,把数据库变成读写模式

select pg_wal_replay_resume();


表空间基于时间点的恢复

经过实验证明,PG不支持表空间不完全恢复,如果做了表空间的时间点恢复,我们发现其它表空间也会做时间点恢复,即整个数据库集群都做时间点恢复,而不是单个表空间做时间点恢复。

CUUG PostgreSQL技术大讲堂系列公开课第40讲-数据库不完全恢复,往期视频及文档,请联系CUUG。