本文介绍MySQL和PostgreSQL的一些特性对比,让大家了解二者的优劣,更好的做出选择。
当前国内的现状,互联网公司使用MySQL的较多,PostgreSQL的使用比例反而不高,但相信看到PG的新特性后,你会爱上她。当然MySQL作为最流行的数据库,依然会吸引大部分人的眼球。
PostgreSQL标榜自己是世界上最先进的开源数据库,甚至PG粉丝或者一些PGER宣称,她可以和Oracle相媲美(虽然PG很强大,但是和Oracle还是有差距的,当然PG优势也是显而易见的),而且没有那么昂贵的价格和傲慢的客服。
当然PG功能完善和强大是最早始于9版本,在10版本快速发展,增加很多功能和特性。PostgreSQL是完全由社区驱动的开源项目,他的核心代码,都是由社区维护,商用版本都是基于PG做的二次开发。
MySQL 声称自己是最流行的开源数据。看现在国内的现状,称得上名副其实。MySQL被卖几次后,最终落到Oracle公司的囊中。正是因此,MySQL之父Monty,修改了MySQL的源代码,创立了MariaDB分支。
简单对比MySQL和PostgreSQL发现,MySQL背后是成熟的商业公司(Oracle有自己的MySQL企业版,收费,有许多社区版没有的特性),而PostgreSQL背后是一个庞大的志愿开发组,相比而言,PostgreSQL的商业性质更少一些,他没有所谓的PostgreSQL企业版,但是存在基于PG开发的一些企业级的PG数据库。
下面将从以下几个方面阐述MySQL和PostgreSQL的异同和优劣,不当之处,还请大家多提意见。
PostgreSQL的BSD协议比MySQL的GPL协议更灵活
开源协议:PostgreSQL基于自由的BSD/MIT许可,组织可以使用、复制、修改和重新分发代码,只需要提供一个版权声明即可。
PG的开源协议特别灵活,任何公司的和个人都可以把PG作为一个产品销售,而不需要像MySQL那样必须修改大部分代码才可以作为公司的产品。
开源协议:核心代码基于GPL或Commercial License。
MySQL的开源协议是基于GPL协议,任何公司都可以免费使用,不允许修改后和衍生的代码做为闭源的商业软件发布和销售,MySQL的版权在甲骨文手中,甲骨文可以推了其商业闭源版本。
MySQL对ACID的支持比PG稍弱
PostgreSQL支持事务的强一致性,事务保证性好,完全支持ACID特性。
MySQL只有innodb引擎支持事务,事务一致性保证上可根据实际需求调整,为了最大限度的保护数据,MySQL可配置双一模式。
PostgreSQL支持几乎所有的SQL标准,而MySQL只支持部分的SQL标准
PostgreSQL几乎支持所有的SQL标准,支持类型相当丰富。
MySQL只支持部分SQL标准,相比于PG支持类型稍弱。
MySQL 通过canal增量数据的订阅和消费,可以同步数据到kafka,通过kafka做数据流转。
MySQL所有的高可用方案都是基于binlog做的同步,以及基于MySQL的分布式数据也是基于MySQL的binlog实现,binlog是MySQL生态圈最基本技术实现。
Postgres 通过逻辑复制实现消息的订阅和消费,可以同步数据到kafka,通过kafka实现数据流转。
PostgreSQL通过其MVCC实现有效地解决了并发问题,从而实现了非常高的并发性。
PG新老数据一起存放的基于XID的MVCC机制,新老数据一起存放,需要定时触 发VACUUM,会带来多余的IO和数据库对象加锁开销,引起数据库整体的并发能力下降。而且VACUUM清理不及时,还可能会引发数据膨胀。
当然PostgreSQL还有一点影响比较,为了保证事务的强一致性,未决事务会影响所有表VACUUM清理,导致表膨胀。
MySQL仅在InnoDB中支持MVCC
innodb的基于回滚段实现的MVCC机制,但是MySQL的间隙锁影响较大,锁定数据较多。
1. MySQL是广泛选择的基于Web的项目,需要数据库只是为了简单的数据事务。但是,当遇到重负载或尝试完成复杂查询时,MySQL通常会表现不佳。
PostgreSQL FDW –[foreign-data wrapper的一个简称,可以叫外部封装。
PostgreSQL不支持多数据引擎。但支持Extension组件扩充,以及通过名为FDW的技术将Oracle、Hadoop、MongoDB、SQLServer、Excel、CSV文件等作为外部表进行读写操作,因此,可以为大数据与关系型数据库提供良好对接。
MySQL:无。
PG主表采用堆表存放,存放的数据量较大,数据访问方式类似于Oracle的堆表。
MySQL采用索引组织表,MySQL必须有主键索引,所有的数据访问都是通过主键实现,二级索引访问时,需要扫描两遍索引(主键和二级索引)。
总体上来说,开源数据库都不是很完善,商业数据库oracle在架构和功能方面都还是完善很多的。
从应用场景来说,PG更加适合严格的企业应用场景(比如金融、电信、ERP、CRM),但不仅仅限制于此,PostgreSQL的json,jsonb,hstore等数据格式,特别适用于一些大数据格式的分析;而MySQL更加适合业务逻辑相对简单、数据可靠性要求较低的互联网场景(比如google、facebook、alibaba),当然现在MySQL的在innodb引擎的大力发展,功能表现良好。