如果说数据是新的石油,那么数据库就是油田、炼油厂、钻井和油泵。数据存放在数据库中,如果你有兴趣利用它,那么掌握相应的现代化的工具就是好的开始。
数据库是工具,它们是到达终点的手段。每种数据库都有自己保存数据和看待世界的方式。你对它们的理解越多,就越能随心所欲,在日益增长的大数据上,就能更好地利用它们潜在的能力。
当前是数据库世界的一个重要时刻。多年来,无论针对的问题是大还是小,关系模型一直是事实上的选择。我们不指望关系数据库会很快消失,但是人们正在从RDBMS的迷雾中走出来,寻找替代的方案,如无模式或可替代的数据结构,可简单复制,具有高可用性,可横向扩展,以及新的查询方法。这些选择统称为NoSQL。
PostgreSQL是数据库世界里的“锤子”。它既广为人知,又容易获得,还很坚固,如果你抡得够猛,它所能解决的问题数量惊人。如果不了解这个最常用的工具,你就不可能成为建筑专家。
PostgreSQL是一个关系数据库管理系统,即它是以集合理论为基础的系统,在实现上,它定义为一些二维表,表中包含数据行和具有严格数据类型的列。虽然人们对新兴数据库越来越有兴趣,但关系数据库仍然是最流行的数据库,而且这种趋势可能会保持很长一段时间。
关系数据库流行的原因,不仅在于其庞大的特性集(触发器、存储过程、高级索引)、数据的安全性(符合ACID),或符合大多数人的思维方式(许多程序员以关系的方式说话和思考),还在于它们的查询灵活性。与其他某些数据存储库相比,你不必事先知道要如何使用这些数据。如果关系数据模式是规范的,那么查询就可以很灵活。PostgreSQL是最好的开源关系数据库例子。
PostgreSQL的扩展包括自然语言解析、多维索引、地理查询、自定义数据类型等。它具有高级的事务处理能力,支持十几种不同语言的存储过程,能在各种平台上运行。PostgreSQL内置支持Unicode、序列、表继承、子查询,而且是市场上遵循ANSI SQL标准最好的关系数据库之一。它快速可靠,可以处理TB量级的数据,并且已经在一些高知名度的生产系统上得到验证,如Skype、法国储蓄银行(CNAF)和美国联邦航空局(FAA)。
自1995年以来,PostgreSQL就以目前的项目形态存在,但它的起源相当久远。20世纪70年代初,最初的项目产生于加州大学伯克利分校,叫做交互式图形和检索系统(Interactive Graphics and Retrieval System),或简称为“Ingres”。在20世纪80年代,推出了一个改进版本,post-Ingres,简称为Postgres。虽然该项目于1993年在伯克利大学终结,但开源社区取得了该项目的源码,并将其发布为PostgreSQL95。后来于1996年更名为PostgreSQL,表示对新的SQL标准的支持,此后一直沿用这个名字。
更多关于PostgreSQL及其他数据库的知识,请参见《七周七数据库》.
内容简介
本书遵循《七周七语言》的写作风格和体例,带领你学习和了解当令最热门的开源数据库。在简单的介绍之后,本书分章介绍了7种数据库。这些数据库分别属于5种不同的数据库风格,但每种数据库都有自己保存数据和看待世界的方式。它们依次是PostgreSQL、Riak、Apache HBase、MongoDB、Apache CouchDB、Neo4J和Redis。本书将深入每一种数据库,介绍它们的优势和不足,以及如何选取一种最符合你的应用需求的数据库。本书适合数据库架构师、数据库管理员,以及想要了解和学习各种NoSQL数据库技术的程序员阅读。本书将帮助读者了解、选择和应用这些数据库,从而更好地发挥日益增长的大数据的能力。