简单分析SQLite4的一些设计改变

1.0 内容提要

SQLite4 是一个放在库中的紧凑的,自包含的,零维护的的ACID数据库引擎, 像SQLite3一样, 但具有改进的接口和文件格式.

运行时环境封装到了一个对象之中.

使用了一个很不错的键值对存储引擎:

  • 一个独立的大型键空间 - 不是SQLite3中那种每个表单独的键空间和索引.
  • 按字典顺序的键排序.
  • 多个存储引擎,可在运行时互换.
  • 默认在磁盘上的存储殷勤使用了一个日志结构的合并数据库.

表的PRIMARY KEY真正被用作存储引擎的键.

可以使用小数点运算.

外键约束和递归触发器默认是启用的.

覆盖指数可以显示声明.

2.0 概述

SQLite4 对于SQLite3而言,是一个可选方案,而不是一个替代方案. SQLite3 还没有过时. SQLite3 和 QLite4 将会并行受到支持. SQLite3 遗留的好处不会被抛弃.   SQLite3 还将会被持续的维护和改进. 但如果需要的话,新系统的设计者现在将可以选择 SQLite4 而不是 SQLite3.

SQLite4 努力保持了SQLite3的最优秀特性,同时在不破坏兼容性的前提下解决了SQLite3中无法修复的问题. SQLite3 和 SQLite4 中将会持续保持一样的特性有:

  • SQLite4 是放在一个库中并链接到一个大型应用程序的完整的,关系型,事务性的, ACID, SQL 数据库引擎.  没有服务器,I/O直接面向硬盘.
  • SQLite4 的源代码任何人可以用于任何目的.  没有版权、发布或者公开源代码或者编译二进制文件方面的的限制.  不用去担心烦人的许可证.
  • 使用了动态类型,而不是大多数其它的SQL数据库引擎所使用的僵化的静态类型.
  • (默认)在磁盘上的镜像是一个单独的使用良好且稳定文件格式的磁盘文件, 使得SQLite4库适合于作为一个应用程序的文件格式使用.
  • SQLite4 将会是快速且可靠的,无需管理员操心它就能运作的蛮好.
  • SQLite4 的实现只有最简化的依赖,因而它可以很容易的集成到嵌入式系统或者其它非常规的运行时环境.

实现上仍然采用常用的汇编语言C。与SQLite3相比,SQLite4使用了更多C99特性,不过仍然可以使用常见的编译器编译。SQLite4使用了诸如size_t,int64_t,uint64_t以及其他标准数据类型。

SQLite4的编程接口与SQLite3的非常相似,只不过命名前缀都从sqlite3_更改为sqlite4_。SQLite3中旧的和作废的接口已经从SQLite4中剔除了。给一些函数增加了参数,有时对参数稍作修改或者对其参数顺序进行重新排序。修改了某些接口名字,使其更加符合其功能。总体上来说,SQLite4的编程接口与SQLite3的非常相似,这样移植一个SQLite3上的应用到SQLite4上只需花一个小时或者两个小时完成搜索替代就可以了。

SQLite3和SQLite4没有共用任何符号,因此把SQLite3和SQLite4同时嵌入到同一进程,同时使用它们都是可行的.

3.0 SQLite4的主要改变
3.1 运行时对象

SQLite4中一些接口的第一个参数接收一个(新加的)指向一个sqlite4_env对象的指针,它定义了运行时环境。需要接收sqlite4_env指针的示例程序包括:

  • sqlite4_open()
  • sqlite4_malloc(), sqlite4_realloc(), and     sqlite4_free()
  • sqlite4_mprintf()
  • sqlite4_random()
  • sqlite4_config()

一个sqlite4_env对象实例定义了SQLite4与其他系统交互是如何交互的。一个sqlite4_env对象包含的方法能够:

  • 分配,进入,离开和收回互斥体
  • 分配,调整和释放堆内存,
  • 访问和控制底层键/值存储引擎,
  • 使用高质量随机种子初始化内建PRNG,
  • 取得当前时间和日期与本地时区,
  • 记录error日志消息.

标准平台(windows和Unix)的SQLite4构建包含了一个全局sqlite4_env对象,通常这个对象适配于所在平台。如果一个接口程序的参数中有一个指向sqlite4_env对象的指针,而且传给这个参数的指针是空指针时,这个接口程序就会使用默认的全局sqlite4_env对象。另外,某些应用可能要求在相同的地址空间上运行两个或者多个SQLite4实例,同时每个实例使用了各自不同的互斥原语,不同的内存堆以及不同的时间日期函数等等。SQLite4通过对每个数据库实例创建不同的sqlite4_env对象来满足这种需求。sqlite4_env对象中还废除了全局和静态变量,这样就可以非常容易地把SQLite4移植到哪些对静态或者全局数据提供有限支持的嵌入式系统中。

3.2 简化的键/值存储引擎

相对于SQLite3,SQLite4使用的键/值存储引擎拥有一个大大简化了的接口。这个存储引擎是可拔插的;通过对qlite4_env对象在打开新的数据库连接前做适当的改动,它可以在运行时被改变。

SQLite4 需要一个实现了有序键/值对的存储引擎,它的键和值是任意长度的二进制数据。键必须惟一,且按字典排序。也就是说,键应该根据一个比较函数进行排序,例如:
 

代码如下:

int key_compare(const void *key1, int n1, const void *key2, int n2){
  int c = memcmp(key1, key2, n1<n2 ? n1 : n2);
  if( c==0 ) c = n1 - n2;
  return c;
}

给定一个探针键,SQLite4需要能够找到它最近的键,然后以字典序升序或降序遍历键。向一个已有的键插入数据时会覆盖旧数据。事务,包括原子提交和回滚,由存储引擎负责。

SQLite4经由表和索引,将所有数据存储到一个单独的键空间, 与此相反,SQLite3中每个表和索引都需要一个单独的键空间。SQLite4的存储也与SQLite3不同,因为它需要存储引擎以字典序对键进行排序, 而SQLite3使用了一个非常复杂的比较函数来决定记录的存储顺序。

SQLite4与存储引擎之间的通信是通过一个定义完善的并且简单的接口进行的。新的存储引擎可以在运行期间进行替换:只要在指定数据库连接之前替换sqlite4_env对象里的某些函数指针就可以了。

如果替换的存储引擎不支持回滚,那么这就意味着SQLite4无法运行ROLLBACK。如果替换的存储引擎不支持事务嵌套,那么这就意味着SQLite4无法运行嵌套事务。因此,嵌入到SQLite4中的存储引擎的功能越少,对应的整体的系统功能就会越差。

默认情况下内置的存储引擎是日志结构的合并式数据库。它比LevelDB要快很多倍,支持嵌套式事务,它把整个内容存储在单一的磁盘文件里。SQLite4的未来版本还可能包含一个内置的采用B树结构的存储引擎。

3.3 现在的PRIMARY KEY是真正的主键

Sqlite3允许声明表中的任何单个或多列为主键。但在内部,SQLite3只将PRIMARY KEY简单地当做唯一约束来对待。实际中用于存储使用的键是每一行的rowid。

Sqlite4则相反,它真实地使用声明的表主键(更确切地说是PRIMARY KEY的编码值)作为键而插入存储引擎。SQLite4表通常没有rowid(除非在表没有PRIMARY KEY的情况下,这时需要一个rowid作为隐式主键。)这意味着内容在磁盘中按主键的顺序存储。这也意味着可以通过对PRIMARY KEY的一次查询即可定位记录。在SQLite3中,主键上的一个搜索意味着在自动创建的索引中先找到rowid,然后依据该rowid对主表做一个二次搜索。

SQLite4 需要 PRIMARY KEY 的所有元素不能为空. 这是一条SQL标准.  由于早期版本的疏忽, SQLite3 没有在PRIMARY KEY 列上强制加上这条NOT NULL约束,到该漏洞被发现的时候SQLite3已经在被广泛使用了, NOT NULL 约束的激活就可能会对太多的程序造成影响.
3.4 十进制数

SQLite4 使用十进制算数做所有的数字计算. SQLite4 从不使用C类型的double或者float(除了在double和内部十进制表示之间转换时使用语接口例程中).  相反,所有数字值在内部表示方式为一个带有3位数字的基于10的指数的18位十进制数.  这一表示方式的特性有:

  • 即使是在缺乏对于IEEE 754 binary64浮点数字支持的平台上,其运作起来也是可靠和兼容的.
  • 货币计算通常可以精确的进行,不需要四舍五入.
  • 任何有符号和无符号的64位整数都能被精确的表示.
  • 浮点数范围和精确度超出了 IEEE 754 binary64 浮点数.
  • 正无穷和负无穷以及 NaN (Not-a-Number) 都有良好的表示方式.

SQLite4 使得整型和浮点型数字之间没有了差别. 不过期却有精确和近似数之间的分别. 在 C/C++ 中, 整形数是精确的而浮点数是近似的. 但SQLite4并不一定如此.  浮点数字在SQLite4可以是精确的.  可以用64位表示的整型数在SQLite4中总是精确的,而大型的整型数则可能是近似的.

SQLite4 数字格式是面向内部使用的.  数字可以在整型和double型之间转换,用于输入和输出.  磁盘上的存储空间需要从1到12位的SQLite4数字值, 这取决于其大小和重要的位数.

3.5 外键约束和递归触发器是默认开启的

外键约束在SQLite3的早期版本中是没有的,并且他们默认关闭了向后兼容的能力。但是外键约束一直是有效的,并且在SQLite4中是默认打开的。所有的外键约束都是默认延迟的,尽管他们能够被定义成立即创建。但是,没有有效的机制去触发外键约束,不管是延迟创建还是立即创建。

SQLite3提供了递归触发器,但是这只是在一个运行时才有效的功能。在SQLite4中,所有的触发器在所有的时间段里都是递归的。

3.6 明确的索引覆盖

SQLite4 像 CREATE TABLE 语句中条件了一个可选的子句,该子句定义了在索引中重复的附加列信息. 这可以让应用程序开发者在SQLite4中无需使用任何花招就可以明确地创建覆盖索引.  例如:

CREATE INDEX cover1 ON table1(a,b) COVERING(c,d);

上面的 cover1 索引可以在存储引擎中用一个单一的查找操作来进行形式如 "SELECT c,d FROM table1 WHERE a=?1 AND b=?2" 的查询.  索引中如果没有附加的 COVERING 子句, SQLite4 也许会在存储引擎中做两次操作; 一次操作基于a和b的值来找到主键,而第二次操作则基于主键来找到c和d的值. COVERING 子句使得c和d的值在索引中就可用,这意味着它们无需第二次查找就可以从索引中提取出来.

COVERING 语句上有一个变化:

CREATE INDEX cover2 ON table(x,y) COVERING ALL;

COVERING ALL 语句的意思是数据表的所有列都在索引中被重复一份,这就确保了原来的数据表永远也不会被访问到,以完成一个使用了这个索引的查询.  这种方法的缺点,当然就是信息重复,而且因此让数据库文件更大.  但是通过在索引指标上明确指定COVERING关闭,SQLite4可以让应用程序开发者权衡着从应用程序中腾出空间和时间来让其更加适用.

时间: 2015-07-01

详解SQLite中的查询规划器

 1.0 介绍 查询规划器的任务是找到最好的算法或者说"查询计划"来完成一条SQL语句.早在SQLite 3.8.0版本,查询规划器的组成部分已经被重写使它可以运行更快并且生成更好的查询计划.这种重写被称作"下一代查询规划器"或者"NGQP". 这篇文章重新概括了查询规划的重要性,提出来一些查询规划固有的问题,并且概括了NGQP是如何解决这些问题. 我们知道的是,NGQP(下一代查询规划器)几乎总是比旧版本的查询规划器好.然而,也许有的应用程序在

SQLite快速入门指南

1. 介绍 SQLite 是一个开源的嵌入式关系数据库,实现自包容.零配置.支持事务的SQL数据库引擎. 其特点是高度便携.使用方便.结构紧凑.高效.可靠. 与其他数据库管理系统不同,SQLite 的安装和运行非常简单,在大多数情况下 - 只要确保SQLite的二进制文件存在即可开始创建.连接和使用数据库.如果您正在寻找一个嵌入式数据库项目或解决方案,SQLite是绝对值得考虑. 2. 安装 SQLite on Windows 进入 SQL 下载页面:http://www.sqlite.org/

详解SQLite中的数据类型

大多数 SQL 数据库引擎 (据我们所知,除 SQLite 之外的所有 SQL 数据库引擎)都使用严格的静态类型.使用静态类型,值的类型便由它的容器 -- 存储值的特定的列 -- 来决定. SQLite 使用更通用的动态类型系统.在 SQLit 中,值的数据类型与值本身相关,而不是与它的容器.SQLite 的动态类型系统与其它数据库引擎的常用静态类型系统是向后兼容的,在这个意义上,工作在静态类型数据库上的 SQL 语句应该以同样的方式工作在 SQLite 中.然而,SQLite 中的动态类型允许

详解 Java中日期数据类型的处理之格式转换的实例

详解 Java中日期数据类型的处理之格式转换的实例 概要: 日期以及时间格式处理,在Java中时间格式一般会涉及到的数据类型包括Calendar类和Date类. Date类: 1.Date类型转String类型(以时间格式1970-01-01 01:01:01为例) //yyyy-MM-dd HH:mm:ss表示24时间进制 SimpleDateFormat sDateFormat=new SimpleDateFormat("yyyy-MM-dd hh:mm:ss"); String

详解javascript中原始数据类型Null和Undefined

当讨论JavaScript中的原始数据类型时,大多数人都知道的基本知识,从String,Number到Boolean.这些原始类型相当简单,行为符合常识.但是,本文将更多聚焦独特的原始数据类型Null和Undefined,是什么让他们如此相似,却又似是而非. 一.理解Null和Undefined 在JavaScript中,null是字面量同时也是语言中的关键字,用来表示无法识别的对象值.换句话说,这用来表示"无值(no value)".虽然相似,undefined实际上代表了不存在的值

详解Lua中的数据类型

Lua是动态类型语言,所以变量没有类型,仅值有类型.值可以被存储在变量中,作为参数传递,并作为结果返回. 在Lua中虽然我们没有变量的数据类型,但我们有类型的值.用于数值数据类型的列表在下面给出.  函数类型 在Lua中有一个叫做函数类型,使我们能够知道变量的类型.如下一些例子给出了下面的代码. 复制代码 代码如下: print(type("What is my type"))   --> string t=10 print(type(5.8*t))              

详解Swift中的数据类型类型转换

一.类型检查与转换 在Objective-C和Java中,任何类型实例都可以通过强转使编译器认为它是另一种类型的实例,这么做其实是将所有的安全检查工作都交给了开发者自己来做.先比之下,Swift中的Optional类型转换就会比较安全与可靠. Swift中使用is关键字来进行类型的检查,其会返回一个布尔值true或者false来表明检查是否成立,示例如下: var str = "HS" if str is String { print(str) } Swift中有向上兼容与向下转换的特

详解java 中Spring jsonp 跨域请求的实例

详解java 中Spring jsonp 跨域请求的实例 jsonp介绍 JSONP(JSON with Padding)是JSON的一种"使用模式",可用于解决主流浏览器的跨域数据访问的问题.由于同源策略,一般来说位于 server1.example.com 的网页无法与不是 server1.example.com的服务器沟通,而 HTML 的<script> 元素是一个例外.利用 <script> 元素的这个开放策略,网页可以得到从其他来源动态产生的 JSO

详解JavaScript中的4种类型识别方法

具体内容如下: 1.typeof [输出]首字母小写的字符串形式 [功能] [a]可以识别标准类型(将Null识别为object) [b]不能识别具体的对象类型(Function除外) [实例] console.log(typeof "jerry");//"string" console.log(typeof 12);//"number" console.log(typeof true);//"boolean" console

详解Javascript中prototype属性(推荐)

在典型的面向对象的语言中,如java,都存在类(class)的概念,类就是对象的模板,对象就是类的实例.但是在Javascript语言体系中,是不存在类(Class)的概念的,javascript中不是基于'类的',而是通过构造函数(constructor)和原型链(prototype chains)实现的.但是在ES6中提供了更接近传统语言的写法,引入了Class(类)这个概念,作为对象的模板.通过class关键字,可以定义类.基本上,ES6的class可以看作只是一个语法糖,它的绝大部分功能

详解IE6中的position:fixed问题与随滚动条滚动的效果

详解IE6中的position:fixed问题与随滚动条滚动的效果 前言: 在<[jQuery]兼容IE6的滚动监听>(点击打开链接)提及到解决IE6fixed问题,具体是要引入一个js文件,还要声明一条脚本就为这个div声明fixed定位去解决,起始这样很不好啊.引入的Javascript不好管理之余,还要在head声明引入javascript,之后又要给这个div声明一个id,之后又要在脚本出弄一条声明,实在是烦死了. 使用position:fixed无非是想做出如下的效果. 基本上pos