比较H2与SQLite:哪个更适合你?

发表时间: 2022-03-02 07:00

背景

像Oracle、Sybase、MySQL和SQL Server这些大家熟知的数据库都属于数据库服务器(当然不排除某些也提供嵌入式版本),而像SQLite、H2等属于嵌入式数据库。 嵌入式数据库跟数据库服务器最大的区别在于它们运行的地址空间不同。通常,数据库服务器独立地运行一个守护进程(daemon),而嵌入式数据库与应用程序运行在同一个进程。本文将介绍一些SQLite、H2。

H2

介绍

H2是一个用Java开发的嵌入式数据库,它本身只是一个类库,可以直接嵌入到应用项目中。H2数据库的前身是 HypersonicSQL,它的名字的含义是 Hypersonic2,H2的发展开始于2004年五月,它的第一个公开发行版本是在2005年12月14日发布的。H2的主要作者是Thomas Mueller,他一直是Hypersonic SQL的源码开发者。在2001年,他加入了PointBase Inc,在那里PointBase Micro被创建。在那时候,他不得不停止Hypersonic SQL,但是这时HSQLDB团队还在为Hypersonic SQL工作。这时一个被叫做H2的项目建立起来,其实H2又叫做Hypersonic 2。然而H2没有共享任何Hypersonic SQL(HSQLDB)的代码。H2的建立是从零开始的。

特点

  • 纯Java编写,不受平台的限制;
  • 只有一个jar文件,适合作为嵌入式数据库使用;
  • h2提供了一个十分方便的web控制台用于操作和管理数据库内容;
  • 功能完整,支持标准SQL和JDBC。麻雀虽小五脏俱全;
  • 支持内嵌模式、服务器模式和集群。
  • 支持全文检索,提供了内置全文检索和使用 Apache Luncene 的全文索引
  • 支持磁盘和内存数据库,支持只读数据库,支持临时表
  • 支持事务(读提交和序列化事务隔离),支持2阶段提交
  • 支持多连接,支持表级锁
  • 使用基于成本的优化机制,对于复杂查询使用零遗传算法进行管理
  • 支持可滑动可更新的结果集,支持大型结果集、支持结果集排序,支持方法返回结果集
  • 支持数据库加密(使用AES或XTEA进行加密),支持SHA-256密码加密,提供加密函数,支持SSL

场景

  • H2最大的用途在于可以同应用程序打包在一起发布,这样可以非常方便地存储少量结构化数据。
  • 它的另一个用途是用于单元测试。启动速度快,而且可以关闭持久化功能,每一个用例执行完随即还原到初始状态。
  • H2的第三个用处是作为缓存,作为NoSQL的一个补充。当某些场景下数据模型必须为关系型,可以拿它当Memcached使,作为后端MySQL/Oracle的一个缓冲层,缓存一些不经常变化但需要频繁访问的数据,比如字典表、权限表。不过这样系统架构就会比较复杂了。
  • 另外由于 H2 文件体积非常小,安装、启动非常简单,且支持全文检索等高级特性,因此在一些简单场景下使用 H2 也能够快速建立起应用。


架构

数据类型

整数(INT)

布尔型(BOOLEAN)

微整数(TINYINT)

小整数(SMALLINT)

大整数(BIGINT)

标识符(IDENTITY)

货币数(DECIMAL)

双精度实数(DOUBLE)

实数(REAL)

时间(TIME)

日期(DATE)

时间戳(TIMESTAMP)

二进制(BINARY)

其他类型(OTHER)

可变字符串(VARCHAR)

不区分大小写可变字符串(VARCHAR_IGNORECASE)

字符(CHAR)

二进制大对象(BLOB)

文本大对象(CLOB)

通用唯一标识符(UUID)

数组(ARRAY)

运行模式

  • 内嵌模式(Embedded Mode):内嵌模式下,应用和数据库同在一个JVM中,通过JDBC进行连接。可持久化,但同时只能一个客户端连接。内嵌模式性能会比较好。如果使用H2数据库的内存模式,那么我们创建的数据库和表都只是保存在内存中,一旦服务器重启,那么内存中的数据库和表就不存在了。
  • 服务器模式(Server Mode):使用服务器模式和内嵌模式一样,只不过它可以跑在另一个进程里。
  • 混合模式:第一个应用以内嵌模式启动它,对于后面的应用来说它是服务器模式跑着的。混合模式是内嵌模式和服务器模式的组合。第一个应用通过内嵌模式与数据库建立连接,同时也作为一个服务器启动,于是另外的应用(运行在不同的进程或是虚拟机上)可以同时访问同样的数据。第一个应用的本地连接与嵌入式模式的连接性能一样的快,而其它连接理论上会略慢。


连接方式

  • 以嵌入式(本地)连接方式连接H2数据库:这种连接方式默认情况下只允许有一个客户端连接到H2数据库,有客户端连接到H2数据库之后,此时数据库文件就会被锁定,那么其他客户端就无法再连接了(jdbc:h2:[file:][<path>]<databaseName>)。
  • 使用TCP/IP的服务器模式(远程连接)方式连接H2数据库:这种连接方式就和其他数据库类似了,是基于Service的形式进行连接的,因此允许多个客户端同时连接到H2数据库(jdbc:h2:tcp://<server>[:<port>]/[<path>]<databaseName>)。


文件锁

数据库打开时,一个锁文件被创建,告诉其他进程,这个数据库已经被占用,如果数据库关闭,或是数据库进程终止,锁文件将被自动删除。

下面是几个锁定文件的方法:

  • 默认的方式是,通过看门狗线程检查文件锁来保护数据库文件,看门狗线程每秒读锁定的文件,检查数据库文件是否可用。
  • 第二种方式是服务器端口方式,打开一个服务器端口,服务器端口方法不要求每秒都去读锁文件,服务器端口只能使用在数据库文件只能在一台计算机(总是同样一台计算机)上访问时使用。
  • 也可以不使用文件锁打开数据库,在这种情况下,需要应用来保护数据库文件。


SQLite

介绍

SQLite,是一款轻型的数据库,是遵守ACID的关系型数据库管理系统,它包含在一个相对小的C库中。它是D.RichardHipp建立的公有领域项目。它的设计目标是嵌入式的,而且已经在很多嵌入式产品中使用了它,它占用资源非常的低,在嵌入式设备中,可能只需要几百K的内存就够了。它能够支持Windows/Linux/Unix等等主流的操作系统,同时能够跟很多程序语言相结合,比如 Tcl、C#、PHP、Java等,还有ODBC接口。SQLite第一个Alpha版本诞生于2000年5月,至2021年已经接近有21个年头,SQLite也迎来了一个版本 SQLite 3已经发布。

特点

  • 支持ACID事务
  • 零配置 – 无需安装和管理配置
  • 储存在单一磁盘文件中的一个完整的数据库
  • 数据库文件可以在不同字节顺序的机器间自由的共享
  • 支持数据库大小至2TB
  • 足够小, 大致13万行C代码, 4.43M
  • 比一些流行的数据库在大部分普通数据库操作要快
  • 简单, 轻松的API
  • 包含TCL绑定, 同时通过Wrapper支持其他语言的绑定
  • 良好注释的源代码, 并且有着90%以上的测试覆盖率
  • 独立: 没有额外依赖
  • 源码完全的开源, 你可以用于任何用途, 包括出售它
  • 支持多种开发语言,C, C++, PHP, Perl, Java, C#,Python, Ruby等

架构

数据类型

Sqlite是一个动态类型系统,sqlite中,值的数据类型跟值本身相关,而不是与它的容器相关。Sqlite的动态类型系统和其他数据库的更为一般的静态类型系统相兼容,但同时,sqlite中的动态类型允许它能做到一些传统刚性类型数据库所不可能做到的事。为了使sqlite和其他数据库间的兼容性最大化,sqlite支持列上“类型亲缘性”的观点,列的类型近似指的是存储在列上数据的推荐类型。这里必须记住一点,这个类型是被推荐,而不是必须的。任何列仍然能存储任意类型的数据。只是一些列,给予选择的话,将会相比于其他的一些类型优选选择一些存储类型,这个列优先选择的存储类型被称为它的“近似”。


决定字段亲缘性的规则,字段的亲缘性是根据该字段在声明时被定义的类型来决定的,具体的规则可以参照以下列表。需要注意的是以下列表的顺序,即如果某一字段类型同时符合两种亲缘性,那么排在前面的规则将先产生作用。

  • 如果类型字符串中包含"INT",那么该字段的亲缘类型是INTEGER。
  • 如果类型字符串中包含"CHAR"、"CLOB"或"TEXT",那么该字段的亲缘类型是TEXT,如VARCHAR。
  • 如果类型字符串中包含"BLOB",那么该字段的亲缘类型是NONE。
  • 如果类型字符串中包含"REAL"、"FLOA"或"DOUB",那么该字段的亲缘类型是REAL。
  • 其余情况下,字段的亲缘类型为NUMERIC。

数据类型

亲缘类型

应用规则

INT

INTEGER

TINYINT

SMALLINT

MEDIUMINT

BIGINT

UNSIGNED BIG INT

INT2

INT8

INTEGER

1

CHARACTER(20)

VARCHAR(255)

VARYING CHARACTER(255)

NCHAR(55)

NATIVE CHARACTER(70)

NVARCHAR(100)

TEXT

CLOB

TEXT

2

BLOB

no datatype specified

NONE

3

REAL

DOUBLE

DOUBLE PRECISION

FLOAT

REAL

4

NUMERIC

DECIMAL(10,5)

BOOLEAN

DATE

DATETIME

NUMERI

5

SQLite 没有单独的 Boolean 存储类。相反,布尔值被存储为整数 0(false)和 1(true)

SQLite 没有一个单独的用于存储日期和/或时间的存储类,但 SQLite 能够把日期和时间存储为 TEXT、REAL 或 INTEGER 值。

存储类

日期格式

TEXT

格式为 "YYYY-MM-DD HH:MM:SS.SSS" 的日期。

REAL

从公元前 4714 年 11 月 24 日格林尼治时间的正午开始算起的天数。

INTEGER

从 1970-01-01 00:00:00 UTC 算起的秒数。


系统架构

在内部,SQLite由以下几个组件组成:内核、SQL编译器、后端以及附件。SQLite通过利用虚拟机和虚拟数据库引擎(VDBE),使调试、修改和扩展SQLite的内核变得更加方便。所有SQL语句都被编译成易读的、可以在SQLite虚拟机中执行的程序集。SQLite支持大小高达2 TB的数据库,每个数据库完全存储在单个磁盘文件中。这些磁盘文件可以在不同字节顺序的计算机之间移动。这些数据以B+树(B+tree)数据结构的形式存储在磁盘上。SQLite根据该文件系统获得其数据库权限。

  • 公共接口(Interface):SQLite库的大部分公共接口由main.c, legacy.c和vdbeapi.c源文件中的函数来实现,这些函数依赖于分散在其他文件中的一些程序,因为在这些文件中它们可以访问有文件作用域的数据结构
  • 词法分析器(Tokenizer):当执行一个包含SQL语句的字符串时,接口程序要把这个字符串传递给tokenizer。Tokenizer的任务是把原有字符串分割成一个个标识符(token),并把这些标识符传递给解析器
  • 语法分析器(Parser):语法分析器的工作是在指定的上下文中赋予标识符具体的含义。SQLite的语法分析器使用Lemon LALR(1)分析程序生成器来产生,Lemon做的工作与YACC/BISON相同,但它使用不同的输入句法,这种句法更不易出错
  • 代码生成器(Code Generator):语法分析器在把标识符组装成完整的SQL语句后,就调用代码生成器产生虚拟机代码,以执行SQL语句请求的工作
  • 虚拟机(Virtual Machine):代码生成器生成的代码由虚拟机来执行,虚拟机实现一个专为操作数据库文件而设计的抽象计算引擎。它有一个存储中间数据的存储栈,每条指令包含一个操作码和不超过三个额外的操作数。
  • B-树(B-Tree): 一个SQLite数据库使用B-树的形式存储在磁盘上,B-树的实现位于源文件btree.c中
  • 页面高速缓存(Page Cache):B-树模块以固定大小的数据块形式从磁盘上请求信息,默认的块大小是1024个字节,但是可以在512和65536个字节之间变化。页面高速缓存负责读、写和缓存这些数据块。页面高速缓存还提供回滚和原子提交的抽象,并且管理数据文件的锁定
  • OS接口:为了在POSIX和Win32操作系统之间提供移植性,SQLite使用一个抽象层来提供操作系统接口
  • 实用工具(Utilities):提供了util.c 工具类包含内存分配和字符串比较的函数。还有一些通用的Hash操作以及Unicode转换子程序
  • 测试代码(Test Code):SQLite提供了测试方案,主要代码文件中有许多assert()语句。另外,源文件test1.c通过test5.c和md5.c实现只用于测试目的的一些扩展。os_test.c后端接口用来模拟断电,以验证页面高速缓存的崩溃恢复机制


总结

综合情况对比H2 database兼容的数据库更多并且支持服务器模式,SQLite的性能要好于H2,但并发性不如,另外SQLite一般使用C的API接口访问,而H2支持JDBC。并且都可以大多数主流平台上,对于C\C++\C#应用而言,使用SQLite是更好的选择。对于Java应用,H2是不错的选择。

比较项目

SQLite

H2 database engine

Footprint

350KiB

~1MB

授权协议

Public domain

Dual: Modified MPL 1.1 / EPL 1.0 (commercial friendly)

自容器

单文件

无服务器

服务器模式

零配置

事物处理

索引

✔ (B-tree, R-tree, full-text)

✔ (B-tree, tree, hash, full-text)

MySQL 兼容性

✔ (并不是100%兼容)

兼容其他数据库

✔ MySQL, PostgreSQL, Oracle, MSSQL, DB2, HSQLDB and Derby

加密

内存中数据库