PostgreSQL 7.1版本并发控制的实战技巧

发表时间: 2024-03-22 14:13

作者:太阳

一、 表系统字段几个比较重要概念

1.1 tuple

tuple表示表中的数据行,在MySQL中用row表示。

在表数据页中,主要分为普通的数据元祖和TOAST元祖。以下是一个普通数据元祖的结构,主要由三部分组成:HeapTupleHeaderData结构、NULL bitmap、user data。

t_xmin : 当一个事务插入一条新的数据行时,将该数据行的xmin标识为当前事务的事务ID

t_xmax : 新插入的数据行的xmax默认为0,当一个事务删除一条数据行时,将该数据行的xmax标识为当前事务的事务ID,相当于做了一个删除标记。

t_cid : 在同一事务内,当该命令操作导致会插入/删除操作时,使用t_cid进行计数

t_ctid : ctid标识了一个数据行tuple在表中的物理位置,ctid可以快速定位数据行,但是随着表数据的变更,在发生vacuum full之后,数据行对应的物理位置可能会发生改变。

1、数据库中查看tuple的ctid

## 查看当前数据行对应的ctiddb1=# select ctid,* from t1; ctid  | id-------+---- (0,1) |  1 (0,2) |  1 (0,3) |  1 (0,4) |  2 (0,5) |  2 (0,6) |  3 (0,7) |  3 (0,8) |  3(8 rows)

2、数据库中查看tuple的xmin、xmax、ctid

db1=# select xmin,xmax,cmin,cmax,* from t2;  xmin   | xmax | cmin | cmax | id | name---------+------+------+------+----+------ 1738613 |    0 |    0 |    0 |  1 | aa 1738614 |    0 |    0 |    0 |  2 | bb 1738615 |    0 |    0 |    0 |  3 | cc(3 rows)

1.2 事务id(txid)

当每个事务开始时,事务管理器都会分配一个唯一的标识符,也就是事务ID(txid), postgresql的txid是一个32位无符号整数,大约42亿。在数据库中可通过内置函数txid_current()查看当前事务ID号。

不会为BEGIN命令分配txid。在PG中,当BEGIN命令后,执行第一个命令时,事务管理器会分配tixd,然后启动其事务。

db1=# begin;BEGINdb1=# SELECT txid_current(); txid_current--------------      1738649(1 row)

postgres保留了以下三个特殊的事务ID号:

0 :无效事务ID。

1 :系统表初始化时事务ID

2 :冻结的事务ID

txid之间可以做比较,小于当前txid的事务为“past”,默认都是对当前事务可见的,大于当前txid的事务为称为“Future”,默认都是对当前事务不可见的。

pg的事务存在上限,随着事务ID的不断增长,达到最大值后再从头开始计数,就会出现以前的事务ID比当前的事务ID大的情况,按照上面的比较规则,就会认为最新产生的事务为“past”,这也是PG数据库中比较严重的事务回卷的问题。

为了解决事务回卷的问题,PG规定最新与最旧的两个事务之间的年龄差最大为231,如果事务之间的年龄差超过231时,就把旧的事务全部转换为事务ID号为2的冻结事务。当新事务与冻结事务做比较时,默认正常事务ID比冻结事务ID新。整体来讲可利用如下公式进行计算:((int32) (id1-id2)) < 0

如果该公式为真,则表示事务id1比事务id2旧。

当事务没有发生回卷时,上面公式相当于直接比大小即可。

当事务发生回卷时,例如id1=4294967295,id2=5,那么id1-id2=4294967290,将这个个差值转换为有符号的int32时,由于超过了2^31该数据会转换为一个负数,这样一来我们还是可以比较出id1比id2旧。

更多技术信息请查看云掣官网云掣YunChe - 可观测运维专家 | 大数据运维托管 | 云MSP服务