SQLITE3 使用总结_Sqlite

前序：

这里要注明，我是一个跨平台专注者，并不喜欢只用 windows 平台。我以前的工作就是为 unix 平台写代码。下面我所写的东西，虽然没有验证，但是我已尽量不使用任何 windows 的东西，只使用标准 c 或标准c++。但是，我没有尝试过在别的系统、别的编译器下编译，因此下面的叙述如果不正确，则留待以后修改。

下面我的代码仍然用 vc 编写，因为我觉得vc是一个很不错的ide，可以加快代码编写速度（例如配合 vassist ）。下面我所说的编译环境，是vc2003。如果读者觉得自己习惯于 unix 下用 vi 编写代码速度较快，可以不用管我的说明，只需要符合自己习惯即可，因为我用的是标准 c 或 c++ 。不会给任何人带来不便。

一、版本

从 www.sqlite.org 网站可下载到最新的 sqlite 代码和编译版本。我写此文章时，最新代码是 3.3.17 版本。

很久没有去下载 sqlite 新代码，因此也不知道 sqlite 变化这么大。以前很多文件，现在全部合并成一个 sqlite3.c 文件。如果单独用此文件，是挺好的，省去拷贝一堆文件还担心有没有遗漏。但是也带来一个问题：此文件太大，快接近7万行代码，vc开它整个机器都慢下来了。如果不需要改它代码，也就不需要打开 sqlite3.c 文件，机器不会慢。但是，下面我要写通过修改 sqlite 代码完成加密功能，那时候就比较痛苦了。如果个人水平较高，建议用些简单的编辑器来编辑，例如ultraedit 或 notepad 。速度会快很多。

二、基本编译

这个不想多说了，在 vc 里新建 dos 控制台空白工程，把 sqlite3.c 和 sqlite3.h 添加到工程，再新建一个 main.cpp文件。在里面写:

为什么要 extern “c” ？如果问这个问题，我不想说太多，这是c++的基础。要在 c++ 里使用一段 c 的代码，必须要用 extern “c” 括起来。c++跟 c虽然语法上有重叠，但是它们是两个不同的东西，内存里的布局是完全不同的，在c++编译器里不用extern “c”括起c代码，会导致编译器不知道该如何为 c 代码描述内存布局。

可能在 sqlite3.c 里人家已经把整段代码都 extern “c” 括起来了，但是你遇到一个 .c 文件就自觉的再括一次，也没什么不好。
基本工程就这样建立起来了。编译，可以通过。但是有一堆的 warning。可以不管它。

三、sqlite操作入门

sqlite提供的是一些c函数接口，你可以用这些函数操作数据库。通过使用这些接口，传递一些标准 sql 语句（以 char * 类型）给 sqlite 函数，sqlite 就会为你操作数据库。
sqlite 跟ms的access一样是文件型数据库，就是说，一个数据库就是一个文件，此数据库里可以建立很多的表，可以建立索引、触发器等等，但是，它实际上得到的就是一个文件。备份这个文件就备份了整个数据库。
sqlite 不需要任何数据库引擎，这意味着如果你需要 sqlite 来保存一些用户数据，甚至都不需要安装数据库(如果你做个小软件还要求人家必须装了sqlserver 才能运行，那也太黑心了)。

下面开始介绍数据库基本操作。

1 基本流程（1）关键数据结构
sqlite 里最常用到的是 sqlite3 * 类型。从数据库打开开始，sqlite就要为这个类型准备好内存，直到数据库关闭，整个过程都需要用到这个类型。当数据库打开时开始，这个类型的变量就代表了你要操作的数据库。下面再详细介绍。

（2）打开数据库
int sqlite3_open( 文件名, sqlite3 ** );
用这个函数开始数据库操作。
需要传入两个参数，一是数据库文件名，比如：c://dongchunguang_database.db。
文件名不需要一定存在，如果此文件不存在，sqlite 会自动建立它。如果它存在，就尝试把它当数据库文件来打开。
sqlite3 ** 参数即前面提到的关键数据结构。这个结构底层细节如何，你不要关它。
函数返回值表示操作是否正确，如果是 sqlite_ok 则表示操作正常。相关的返回值sqlite定义了一些宏。具体这些宏的含义可以参考 sqlite3.h 文件。里面有详细定义（顺便说一下，sqlite3 的代码注释率自称是非常高的，实际上也的确很高。只要你会看英文，sqlite 可以让你学到不少东西）。
下面介绍关闭数据库后，再给一段参考代码。

（3）关闭数据库
int sqlite3_close(sqlite3 *);
前面如果用 sqlite3_open 开启了一个数据库，结尾时不要忘了用这个函数关闭数据库。
下面给段简单的代码：

这就是一次数据库操作过程。

2 sql语句操作
本节介绍如何用sqlite 执行标准 sql 语法。

（1）执行sql语句
int sqlite3_exec(sqlite3*, const char *sql, sqlite3_callback, void *, char **errmsg );
这就是执行一条 sql 语句的函数。
第1个参数不再说了，是前面open函数得到的指针。说了是关键数据结构。
第2个参数const char *sql 是一条 sql 语句，以/0结尾。
第3个参数sqlite3_callback 是回调，当这条语句执行之后，sqlite3会去调用你提供的这个函数。（什么是回调函数，自己找别的资料学习）
第4个参数void * 是你所提供的指针，你可以传递任何一个指针参数到这里，这个参数最终会传到回调函数里面，如果不需要传递指针给回调函数，可以填null。等下我们再看回调函数的写法，以及这个参数的使用。
第5个参数char ** errmsg 是错误信息。注意是指针的指针。sqlite3里面有很多固定的错误信息。执行 sqlite3_exec 之后，执行失败时可以查阅这个指针（直接 printf(“%s/n”,errmsg)）得到一串字符串信息，这串信息告诉你错在什么地方。sqlite3_exec函数通过修改你传入的指针的指针，把你提供的指针指向错误提示信息，这样sqlite3_exec函数外面就可以通过这个 char*得到具体错误提示。
说明：通常，sqlite3_callback 和它后面的 void * 这两个位置都可以填 null。填null表示你不需要回调。比如你做insert 操作，做 delete 操作，就没有必要使用回调。而当你做 select 时，就要使用回调，因为 sqlite3 把数据查出来，得通过回调告诉你查出了什么数据。

（2）exec 的回调
typedef int (*sqlite3_callback)(void*,int,char**, char**);
你的回调函数必须定义成上面这个函数的类型。下面给个简单的例子：

通过上面的例子，应该可以知道如何打开一个数据库，如何做数据库基本操作。
有这些知识，基本上可以应付很多数据库操作了。

（3）不使用回调查询数据库
上面介绍的 sqlite3_exec 是使用回调来执行 select 操作。还有一个方法可以直接查询而不需要回调。但是，我个人感觉还是回调好，因为代码可以更加整齐，只不过用回调很麻烦，你得声明一个函数，如果这个函数是类成员函数，你还不得不把它声明成 static 的（要问为什么？这又是c++基础了。c++成员函数实际上隐藏了一个参数：this，c++调用类的成员函数的时候，隐含把类指针当成函数的第一个参数传递进去。结果，这造成跟前面说的 sqlite 回调函数的参数不相符。只有当把成员函数声明成 static 时，它才没有多余的隐含的this参数）。
虽然回调显得代码整齐，但有时候你还是想要非回调的 select 查询。这可以通过 sqlite3_get_table 函数做到。
int sqlite3_get_table(sqlite3*, const char *sql, char ***resultp, int *nrow, int *ncolumn, char **errmsg );

第1个参数不再多说，看前面的例子。
第2个参数是 sql 语句，跟 sqlite3_exec 里的 sql 是一样的。是一个很普通的以/0结尾的char *字符串。
第3个参数是查询结果，它依然一维数组（不要以为是二维数组，更不要以为是三维数组）。它内存布局是：第一行是字段名称，后面是紧接着是每个字段的值。下面用例子来说事。
第4个参数是查询出多少条记录（即查出多少行）。
第5个参数是多少个字段（多少列）。
第6个参数是错误信息，跟前面一样，这里不多说了。

下面给个简单例子:

到这个例子为止，sqlite3 的常用用法都介绍完了。
用以上的方法，再配上 sql 语句，完全可以应付绝大多数数据库需求。
但有一种情况，用上面方法是无法实现的：需要insert、select 二进制。当需要处理二进制数据时，上面的方法就没办法做到。下面这一节说明如何插入二进制数据

3 操作二进制

sqlite 操作二进制数据需要用一个辅助的数据类型：sqlite3_stmt * 。
这个数据类型记录了一个“sql语句”。为什么我把 “sql语句” 用双引号引起来？因为你可以把 sqlite3_stmt * 所表示的内容看成是 sql语句，但是实际上它不是我们所熟知的sql语句。它是一个已经把sql语句解析了的、用sqlite自己标记记录的内部数据结构。
正因为这个结构已经被解析了，所以你可以往这个语句里插入二进制数据。当然，把二进制数据插到 sqlite3_stmt 结构里可不能直接 memcpy ，也不能像 std::string 那样用 + 号。必须用 sqlite 提供的函数来插入。

（1）写入二进制
下面说写二进制的步骤。
要插入二进制，前提是这个表的字段的类型是 blob 类型。我假设有这么一张表：
create table tbl_2( id integer, file_content blob )

首先声明
sqlite3_stmt * stat;

然后，把一个 sql 语句解析到 stat 结构里去：
sqlite3_prepare( db, “insert into tbl_2( id, file_content) values( 10, ? )”, -1, &stat, 0 );

上面的函数完成 sql 语句的解析。第一个参数跟前面一样，是个 sqlite3 * 类型变量，第二个参数是一个 sql 语句。
这个 sql 语句特别之处在于 values 里面有个 ? 号。在sqlite3_prepare函数里，?号表示一个未定的值，它的值等下才插入。
第三个参数我写的是-1，这个参数含义是前面 sql 语句的长度。如果小于0，sqlite会自动计算它的长度（把sql语句当成以/0结尾的字符串）。
第四个参数是 sqlite3_stmt 的指针的指针。解析以后的sql语句就放在这个结构里。
第五个参数我也不知道是干什么的。为0就可以了。
如果这个函数执行成功（返回值是 sqlite_ok 且 stat 不为null ），那么下面就可以开始插入二进制数据。
sqlite3_bind_blob( stat, 1, pdata, (int)(length_of_data_in_bytes), null ); // pdata为数据缓冲区，length_of_data_in_bytes为数据大小，以字节为单位

这个函数一共有5个参数。
第1个参数：是前面prepare得到的 sqlite3_stmt * 类型变量。
第2个参数：?号的索引。前面prepare的sql语句里有一个?号，假如有多个?号怎么插入？方法就是改变 bind_blob 函数第2个参数。这个参数我写1，表示这里插入的值要替换 stat 的第一个?号（这里的索引从1开始计数，而非从0开始）。如果你有多个?号，就写多个 bind_blob 语句，并改变它们的第2个参数就替换到不同的?号。如果有?号没有替换，sqlite为它取值null。
第3个参数：二进制数据起始指针。
第4个参数：二进制数据的长度，以字节为单位。
第5个参数：是个析够回调函数，告诉sqlite当把数据处理完后调用此函数来析够你的数据。这个参数我还没有使用过，因此理解也不深刻。但是一般都填null，需要释放的内存自己用代码来释放。

bind完了之后，二进制数据就进入了你的“sql语句”里了。你现在可以把它保存到数据库里：

通过这个语句，stat 表示的sql语句就被写到了数据库里。
最后，要把 sqlite3_stmt 结构给释放：
sqlite3_finalize( stat ); //把刚才分配的内容析构掉

（2）读出二进制

下面说读二进制的步骤。
跟前面一样，先声明 sqlite3_stmt * 类型变量：

然后，把一个 sql 语句解析到 stat 结构里去：

当 prepare 成功之后（返回值是 sqlite_ok ），开始查询数据。

这一句的返回值是sqlite_row 时表示成功（不是 sqlite_ok ）。
你可以循环执行sqlite3_step 函数，一次step查询出一条记录。直到返回值不为 sqlite_row 时表示查询结束。
然后开始获取第一个字段：id 的值。id是个整数，用下面这个语句获取它的值：
int id = sqlite3_column_int( stat, 0 ); //第2个参数表示获取第几个字段内容，从0开始计算，因为我的表的id字段是第一个字段，因此这里我填0

下面开始获取 file_content 的值，因为 file_content 是二进制，因此我需要得到它的指针，还有它的长度：

这样就得到了二进制的值。
把 pfilecontent 的内容保存出来之后，不要忘了释放 sqlite3_stmt 结构：
sqlite3_finalize( stat ); //把刚才分配的内容析构掉

（3）重复使用 sqlite3_stmt 结构

如果你需要重复使用 sqlite3_prepare 解析好的 sqlite3_stmt 结构，需要用函数： sqlite3_reset。

这样， stat 结构又成为 sqlite3_prepare 完成时的状态，你可以重新为它 bind 内容。

4 事务处理

sqlite 是支持事务处理的。如果你知道你要同步删除很多数据，不仿把它们做成一个统一的事务。
通常一次 sqlite3_exec 就是一次事务，如果你要删除1万条数据，sqlite就做了1万次：开始新事务->删除一条数据->提交事务->开始新事务->… 的过程。这个操作是很慢的。因为时间都花在了开始事务、提交事务上。
你可以把这些同类操作做成一个事务，这样如果操作错误，还能够回滚事务。

事务的操作没有特别的接口函数，它就是一个普通的 sql 语句而已：
分别如下：

四、c/c++开发接口简介1 总览

sqlite3是sqlite一个全新的版本,它虽然是在sqlite 2.8.13的代码基础之上开发的,但是使用了和之前的版本不兼容的数据库格式和api. sqlite3是为了满足以下的需求而开发的:
支持utf-16编码.
用户自定义的文本排序方法.
可以对blobs字段建立索引.
因此为了支持这些特性我改变了数据库的格式,建立了一个与之前版本不兼容的3.0版. 至于其他的兼容性的改变,例如全新的api等等,都将在理论介绍之后向你说明,这样可以使你最快的一次性摆脱兼容性问题.
3.0版的和2.x版的api非常相似,但是有一些重要的改变需要注意. 所有api接口函数和数据结构的前缀都由"sqlite_"改为了"sqlite3_". 这是为了避免同时使用sqlite 2.x和sqlite 3.0这两个版本的时候发生链接冲突.
由于对于c语言应该用什么数据类型来存放utf-16编码的字符串并没有一致的规范. 因此sqlite使用了普通的void* 类型来指向utf-16编码的字符串. 客户端使用过程中可以把void*映射成适合他们的系统的任何数据类型.

2 c/c++接口
sqlite 3.0一共有83个api函数,此外还有一些数据结构和预定义(#defines). (完整的api介绍请参看另一份文档.) 不过你们可以放心,这些接口使用起来不会像它的数量所暗示的那么复杂. 最简单的程序仍然使用三个函数就可以完成: sqlite3_open(), sqlite3_exec(), 和 sqlite3_close(). 要是想更好的控制数据库引擎的执行,可以使用提供的sqlite3_prepare()函数把sql语句编译成字节码,然后在使用sqlite3_step()函数来执行编译后的字节码. 以sqlite3_column_开头的一组api函数用来获取查询结果集中的信息. 许多接口函数都是成对出现的,同时有utf-8和utf-16两个版本. 并且提供了一组函数用来执行用户自定义的sql函数和文本排序函数.

（1）如何打开关闭数据库

sqlite3_open() 函数返回一个整数错误代码,而不是像第二版中一样返回一个指向sqlite3结构体的指针. sqlite3_open() 和sqlite3_open16() 的不同之处在于sqlite3_open16() 使用utf-16编码(使用本地主机字节顺序)传递数据库文件名. 如果要创建新数据库, sqlite3_open16() 将内部文本转换为utf-16编码, 反之sqlite3_open() 将文本转换为utf-8编码.
打开或者创建数据库的命令会被缓存,直到这个数据库真正被调用的时候才会被执行. 而且允许使用pragma声明来设置如本地文本编码或默认内存页面大小等选项和参数.
sqlite3_errcode() 通常用来获取最近调用的api接口返回的错误代码. sqlite3_errmsg() 则用来得到这些错误代码所对应的文字说明. 这些错误信息将以 utf-8 的编码返回,并且在下一次调用任何sqlite api函数的时候被清除. sqlite3_errmsg16() 和sqlite3_errmsg() 大体上相同,除了返回的错误信息将以 utf-16 本机字节顺序编码.
sqlite3的错误代码相比sqlite2没有任何的改变,它们分别是:

（2）执行 sql 语句
typedef int (*sqlite_callback)(void*,int,char**, char**);
int sqlite3_exec(sqlite3*, const char *sql, sqlite_callback, void*, char**);
sqlite3_exec 函数依然像它在sqlite2中一样承担着很多的工作. 该函数的第二个参数中可以编译和执行零个或多个sql语句. 查询的结果返回给回调函数. 更多地信息可以查看api 参考.
在sqlite3里,sqlite3_exec一般是被准备sql语句接口封装起来使用的.

sqlite3_prepare 接口把一条sql语句编译成字节码留给后面的执行函数. 使用该接口访问数据库是当前比较好的的一种方法.
sqlite3_prepare() 处理的sql语句应该是utf-8编码的. 而sqlite3_prepare16() 则要求是utf-16编码的. 输入的参数中只有第一个sql语句会被编译. 第四个参数则用来指向输入参数中下一个需要编译的sql语句存放的sqlite statement对象的指针,任何时候如果调用 sqlite3_finalize() 将销毁一个准备好的sql声明. 在数据库关闭之前，所有准备好的声明都必须被释放销毁. sqlite3_reset() 函数用来重置一个sql声明的状态，使得它可以被再次执行.

sql声明可以包含一些型如"?" 或 "?nnn" 或 ":aaa"的标记，其中"nnn" 是一个整数，"aaa" 是一个字符串. 这些标记代表一些不确定的字符值（或者说是通配符），可以在后面用sqlite3_bind 接口来填充这些值. 每一个通配符都被分配了一个编号（由它在sql声明中的位置决定，从1开始），此外也可以用 "nnn" 来表示 "?nnn" 这种情况. 允许相同的通配符在同一个sql声明中出现多次, 在这种情况下所有相同的通配符都会被替换成相同的值. 没有被绑定的通配符将自动取null值.

以上是 sqlite3_bind 所包含的全部接口，它们是用来给sql声明中的通配符赋值的. 没有绑定的通配符则被认为是空值.绑定上的值不会被sqlite3_reset()函数重置. 但是在调用了sqlite3_reset()之后所有的通配符都可以被重新赋值.

在sql声明准备好之后(其中绑定的步骤是可选的), 需要调用以下的方法来执行:
int sqlite3_step(sqlite3_stmt*);

如果sql返回了一个单行结果集，sqlite3_step() 函数将返回 sqlite_row , 如果sql语句执行成功或者正常将返回sqlite_done , 否则将返回错误代码. 如果不能打开数据库文件则会返回 sqlite_busy . 如果函数的返回值是sqlite_row, 那么下边的这些方法可以用来获得记录集行中的数据:

sqlite3_column_count()函数返回结果集中包含的列数. sqlite3_column_count() 可以在执行了 sqlite3_prepare()之后的任何时刻调用. sqlite3_data_count()除了必需要在sqlite3_step()之后调用之外，其他跟sqlite3_column_count() 大同小异. 如果调用sqlite3_step() 返回值是 sqlite_done 或者一个错误代码, 则此时调用sqlite3_data_count() 将返回 0 ，然而sqlite3_column_count() 仍然会返回结果集中包含的列数.
返回的记录集通过使用其它的几个 sqlite3_column_***() 函数来提取, 所有的这些函数都把列的编号作为第二个参数. 列编号从左到右以零起始. 请注意它和之前那些从1起始的参数的不同.

sqlite3_column_type()函数返回第n列的值的数据类型. 具体的返回值如下:

sqlite3_column_decltype() 则用来返回该列在 create table 语句中声明的类型. 它可以用在当返回类型是空字符串的时候. sqlite3_column_name() 返回第n列的字段名. sqlite3_column_bytes() 用来返回 utf-8 编码的blobs列的字节数或者text字符串的字节数. sqlite3_column_bytes16() 对于blobs列返回同样的结果，但是对于text字符串则按 utf-16 的编码来计算字节数. sqlite3_column_blob() 返回 blob 数据. sqlite3_column_text() 返回 utf-8 编码的 text 数据. sqlite3_column_text16() 返回 utf-16 编码的 text 数据. sqlite3_column_int() 以本地主机的整数格式返回一个整数值. sqlite3_column_int64() 返回一个64位的整数. 最后, sqlite3_column_double() 返回浮点数.
不一定非要按照sqlite3_column_type()接口返回的数据类型来获取数据. 数据类型不同时软件将自动转换.

（3）用户自定义函数
可以使用以下的方法来创建用户自定义的sql函数:

narg 参数用来表明自定义函数的参数个数. 如果参数值为0，则表示接受任意个数的参数. 用 etextrep 参数来表明传入参数的编码形式. 参数值可以是上面的五种预定义值. sqlite3 允许同一个自定义函数有多种不同的编码参数的版本. 数据库引擎会自动选择转换参数编码个数最少的版本使用.
普通的函数只需要设置 xfunc 参数，而把 xstep 和 xfinal 设为null. 聚合函数则需要设置 xstep 和 xfinal 参数，然后把 xfunc 设为null. 该方法和使用sqlite3_create_aggregate() api一样.
sqlite3_create_function16()和sqlite_create_function()的不同就在于自定义的函数名一个要求是 utf-16 编码，而另一个则要求是 utf-8.
请注意自定函数的参数目前使用了sqlite3_value结构体指针替代了sqlite version 2.x中的字符串指针. 下面的函数用来从sqlite3_value结构体中提取数据:

上面的函数调用以下的api来获得上下文内容和返回结果:

（4）用户自定义排序规则
下面的函数用来实现用户自定义的排序规则:

sqlite3_create_collation() 函数用来声明一个排序序列和实现它的比较函数. 比较函数只能用来做文本的比较. etextrep 参数可以取如下的预定义值 sqlite_utf8, sqlite_utf16le, sqlite_utf16be, sqlite_any，用来表示比较函数所处理的文本的编码方式. 同一个自定义的排序规则的同一个比较函数可以有 utf-8, utf-16le 和 utf-16be 等多个编码的版本. sqlite3_create_collation16()和sqlite3_create_collation() 的区别也仅仅在于排序名称的编码是 utf-16 还是 utf-8.
可以使用 sqlite3_collation_needed() 函数来注册一个回调函数，当数据库引擎遇到未知的排序规则时会自动调用该函数. 在回调函数中可以查找一个相似的比较函数，并激活相应的sqlite_3_create_collation()函数. 回调函数的第四个参数是排序规则的名称，同样sqlite3_collation_needed采用 utf-8 编码. sqlite3_collation_need16() 采用 utf-16 编码.

五、给数据库加密
前面所说的内容网上已经有很多资料，虽然比较零散，但是花点时间也还是可以找到的。现在要说的这个——数据库加密，资料就很难找。也可能是我操作水平不够，找不到对应资料。但不管这样，我还是通过网上能找到的很有限的资料，探索出了给sqlite数据库加密的完整步骤。
这里要提一下，虽然 sqlite 很好用，速度快、体积小巧。但是它保存的文件却是明文的。若不信可以用 notepad 打开数据库文件瞧瞧，里面 insert 的内容几乎一览无余。这样赤裸裸的展现自己，可不是我们的初衷。当然，如果你在嵌入式系统、智能手机上使用 sqlite，最好是不加密，因为这些系统运算能力有限，你做为一个新功能提供者，不能把用户有限的运算能力全部花掉。
sqlite为了速度而诞生。因此sqlite本身不对数据库加密，要知道，如果你选择标准aes算法加密，那么一定有接近50%的时间消耗在加解密算法上，甚至更多（性能主要取决于你算法编写水平以及你是否能使用cpu提供的底层运算能力，比如mmx或sse系列指令可以大幅度提升运算速度）。
sqlite免费版本是不提供加密功能的，当然你也可以选择他们的收费版本，那你得支付2000块钱，而且是usd。我这里也不是说支付钱不好，如果只为了数据库加密就去支付2000块，我觉得划不来。因为下面我将要告诉你如何为免费的sqlite扩展出加密模块——自己动手扩展，这是sqlite允许，也是它提倡的。
那么，就让我们一起开始为 sqlite3.c 文件扩展出加密模块。

1 必要的宏
通过阅读 sqlite 代码（当然没有全部阅读完，6万多行代码，没有一行是我习惯的风格，我可没那么多眼神去看），我搞清楚了两件事：
sqlite是支持加密扩展的；
需要 #define 一个宏才能使用加密扩展。
这个宏就是 sqlite_has_codec。
你在代码最前面（也可以在 sqlite3.h 文件第一行）定义：
#ifndef sqlite_has_codec
#define sqlite_has_codec
#endif

如果你在代码里定义了此宏，但是还能够正常编译，那么应该是操作没有成功。因为你应该会被编译器提示有一些函数无法链接才对。如果你用的是 vc 2003，你可以在“解决方案”里右键点击你的工程，然后选“属性”，找到“c/c++”，再找到“命令行”，在里面手工添加“/d "sqlite_has_codec"”。
定义了这个宏，一些被 sqlite 故意屏蔽掉的代码就被使用了。这些代码就是加解密的接口。
尝试编译，vc会提示你有一些函数无法链接，因为找不到他们的实现。
如果你也用的是vc2003，那么会得到下面的提示：
error lnk2019: 无法解析的外部符号 _sqlite3codecgetkey ，该符号在函数 _attachfunc 中被引用
error lnk2019: 无法解析的外部符号 _sqlite3codecattach ，该符号在函数 _attachfunc 中被引用
error lnk2019: 无法解析的外部符号 _sqlite3_activate_see ，该符号在函数 _sqlite3pragma 中被引用
error lnk2019: 无法解析的外部符号 _sqlite3_key ，该符号在函数 _sqlite3pragma 中被引用
fatal error lnk1120: 4 个无法解析的外部命令

这是正常的，因为sqlite只留了接口而已，并没有给出实现。
下面就让我来实现这些接口。

2自己实现加解密接口函数
如果真要我从一份 www.sqlite.org 网上down下来的 sqlite3.c 文件，直接摸索出这些接口的实现，我认为我还没有这个能力。
好在网上还有一些代码已经实现了这个功能。通过参照他们的代码以及不断编译中vc给出的错误提示，最终我把整个接口整理出来。
实现这些预留接口不是那么容易，要重头说一次怎么回事很困难。我把代码都写好了，直接把他们按我下面的说明拷贝到 sqlite3.c 文件对应地方即可。我在下面也提供了sqlite3.c 文件，可以直接参考或取下来使用。

这里要说一点的是，我另外新建了两个文件：crypt.c和crypt.h。
其中crypt.h如此定义：

这个文件很容易看，就两函数，一个加密一个解密。传进来的参数分别是待处理的数据、数据长度、密钥、密钥长度。
处理时直接把结果作用于 pdata 指针指向的内容。
你需要定义自己的加解密过程，就改动这两个函数，其它部分不用动。扩展起来很简单。
这里有个特点，data_len 一般总是 1024 字节。正因为如此，你可以在你的算法里使用一些特定长度的加密算法，比如aes要求被加密数据一定是128位（16字节）长。这个1024不是碰巧，而是 sqlite 的页定义是1024字节，在sqlite3.c文件里有定义:
# define sqlite_default_page_size 1024
你可以改动这个值，不过还是建议没有必要不要去改它。

上面写了两个扩展函数，如何把扩展函数跟 sqlite 挂接起来，这个过程说起来比较麻烦。我直接贴代码。
分3个步骤。
首先，在 sqlite3.c 文件顶部，添加下面内容：

用于在 sqlite3 最后关闭时释放一些内存

这个函数之所以要在 sqlite3.c 开头声明，是因为下面在 sqlite3.c 里面某些函数里要插入这个函数调用。所以要提前声明。

其次，在sqlite3.c文件里搜索“sqlite3pagerclose”函数，要找到它的实现代码（而不是声明代码）。
实现代码里一开始是：

需要在这部分后面紧接着插入：

这里要注意，sqlite3pagerclose 函数大概也是 3.3.17版本左右才改名的，以前版本里是叫 “sqlite3pager_close”。因此你在老版本sqlite代码里搜索“sqlite3pagerclose”是搜不到的。
类似的还有“sqlite3pager_get”、“sqlite3pager_unref”、“sqlite3pager_write”、“sqlite3pager_pagecount”等都是老版本函数，它们在 pager.h 文件里定义。新版本对应函数是在 sqlite3.h 里定义（因为都合并到 sqlite3.c和sqlite3.h两文件了）。所以，如果你在使用老版本的sqlite，先看看 pager.h 文件，这些函数不是消失了，也不是新蹦出来的，而是老版本函数改名得到的。

最后，往sqlite3.c 文件下找。找到最后一行：

/************** end of main.c ************************************************/

在这一行后面，接上本文最下面的代码段。
这些代码很长，我不再解释，直接接上去就得了。
唯一要提的是 derivekey 函数。这个函数是对密钥的扩展。比如，你要求密钥是128位，即是16字节，但是如果用户只输入 1个字节呢？2个字节呢？或输入50个字节呢？你得对密钥进行扩展，使之符合16字节的要求。
derivekey 函数就是做这个扩展的。有人把接收到的密钥求md5，这也是一个办法，因为md5运算结果固定16字节，不论你有多少字符，最后就是16字节。这是md5算法的特点。但是我不想用md5，因为还得为它添加包含一些 md5 的.c或.cpp文件。我不想这么做。我自己写了一个算法来扩展密钥，很简单的算法。当然，你也可以使用你的扩展方法，也而可以使用md5 算法。只要修改 derivekey 函数就可以了。
在 derivekey 函数里，只管申请空间构造所需要的密钥，不需要释放，因为在另一个函数里有释放过程，而那个函数会在数据库关闭时被调用。参考我的 derivekey 函数来申请内存。

这里我给出我已经修改好的 sqlite3.c 和 sqlite3.h 文件。
如果太懒，就直接使用这两个文件，编译肯定能通过，运行也正常。当然，你必须按我前面提的，新建 crypt.h 和crypt.c 文件，而且函数要按我前面定义的要求来做。
3 加密使用方法
现在，你代码已经有了加密功能。
你要把加密功能给用上，除了改 sqlite3.c 文件、给你工程添加 sqlite_has_codec 宏，还得修改你的数据库调用函数。
前面提到过，要开始一个数据库操作，必须先 sqlite3_open 。
加解密过程就在 sqlite3_open 后面操作。
假设你已经 sqlite3_open 成功了，紧接着写下面的代码：
     int i;
//添加、使用密码
     i = sqlite3_key( db, "dcg", 3 );
     //修改密码
     i = sqlite3_rekey( db, "dcg", 0 );
用 sqlite3_key 函数来提交密码。
第1个参数是 sqlite3 * 类型变量，代表着用 sqlite3_open 打开的数据库（或新建数据库）。
第2个参数是密钥。
第3个参数是密钥长度。
用 sqlite3_rekey 来修改密码。参数含义同 sqlite3_key。

实际上，你可以在sqlite3_open函数之后，到 sqlite3_close 函数之前任意位置调用 sqlite3_key 来设置密码。
但是如果你没有设置密码，而数据库之前是有密码的，那么你做任何操作都会得到一个返回值：sqlite_notadb，并且得到错误提示：“file is encrypted or is not a database”。
只有当你用 sqlite3_key 设置了正确的密码，数据库才会正常工作。
如果你要修改密码，前提是你必须先 sqlite3_open 打开数据库成功，然后 sqlite3_key 设置密钥成功，之后才能用sqlite3_rekey 来修改密码。
如果数据库有密码，但你没有用 sqlite3_key 设置密码，那么当你尝试用 sqlite3_rekey 来修改密码时会得到sqlite_notadb 返回值。
如果你需要清空密码，可以使用：
//修改密码
i = sqlite3_rekey( db, null, 0 );
来完成密码清空功能。

4 sqlite3.c 最后添加代码段

五、性能优化
很多人直接就使用了，并未注意到sqlite也有配置参数，可以对性能进行调整。有时候，产生的结果会有很大影响。
主要通过pragma指令来实现。
比如：空间释放、磁盘同步、cache大小等。
不要打开。前文提高了，vacuum的效率非常低！

1 auto_vacuum
pragma auto_vacuum;
pragma auto_vacuum = 0 | 1;
查询或设置数据库的auto-vacuum标记。
正常情况下，当提交一个从数据库中删除数据的事务时，数据库文件不改变大小。未使用的文件页被标记并在以后的添加操作中再次使用。这种情况下使用vacuum命令释放删除得到的空间。
当开启auto-vacuum，当提交一个从数据库中删除数据的事务时，数据库文件自动收缩， (vacuum命令在auto-vacuum开启的数据库中不起作用)。数据库会在内部存储一些信息以便支持这一功能，这使得数据库文件比不开启该选项时稍微大一些。
只有在数据库中未建任何表时才能改变auto-vacuum标记。试图在已有表的情况下修改不会导致报错。

2 cache_size
建议改为8000
pragma cache_size;
pragma cache_size = number-of-pages;
查询或修改sqlite一次存储在内存中的数据库文件页数。每页使用约1.5k内存，缺省的缓存大小是2000. 若需要使用改变大量多行的update或delete命令，并且不介意sqlite使用更多的内存的话，可以增大缓存以提高性能。
当使用cache_size pragma改变缓存大小时，改变仅对当前对话有效，当数据库关闭重新打开时缓存大小恢复到缺省大小。要想永久改变缓存大小，使用default_cache_size pragma.

3 case_sensitive_like
打开。不然搜索中文字串会出错。
pragma case_sensitive_like;
pragma case_sensitive_like = 0 | 1;
like运算符的缺省行为是忽略latin1字符的大小写。因此在缺省情况下'a' like 'a'的值为真。可以通过打开case_sensitive_like pragma来改变这一缺省行为。当启用case_sensitive_like，'a' like 'a'为假而 'a' like 'a'依然为真。

4 count_changes
打开。便于调试
pragma count_changes;
pragma count_changes = 0 | 1;
查询或更改count-changes标记。正常情况下insert, update和delete语句不返回数据。当开启count-changes，以上语句返回一行含一个整数值的数据——该语句插入，修改或删除的行数。返回的行数不包括由触发器产生的插入，修改或删除等改变的行数。

5 page_size
pragma page_size;
pragma page_size = bytes;
查询或设置page-size值。只有在未创建数据库时才能设置page-size。页面大小必须是2的整数倍且大于等于512小于等于8192。上限可以通过在编译时修改宏定义sqlite_max_page_size的值来改变。上限的上限是32768.

6 synchronous
如果有定期备份的机制，而且少量数据丢失可接受，用off
pragma synchronous;
pragma synchronous = full; (2)
pragma synchronous = normal; (1)
pragma synchronous = off; (0)
查询或更改"synchronous"标记的设定。第一种形式(查询)返回整数值。当synchronous设置为full (2), sqlite数据库引擎在紧急时刻会暂停以确定数据已经写入磁盘。这使系统崩溃或电源出问题时能确保数据库在重起后不会损坏。full synchronous很安全但很慢。当synchronous设置为normal, sqlite数据库引擎在大部分紧急时刻会暂停，但不像full模式下那么频繁。 normal模式下有很小的几率(但不是不存在)发生电源故障导致数据库损坏的情况。但实际上，在这种情况下很可能你的硬盘已经不能使用，或者发生了其他的不可恢复的硬件错误。设置为synchronous off (0)时，sqlite在传递数据给系统以后直接继续而不暂停。若运行sqlite的应用程序崩溃，数据不会损伤，但在系统崩溃或写入数据时意外断电的情况下数据库可能会损坏。另一方面，在synchronous off时一些操作可能会快50倍甚至更多。
在sqlite 2中，缺省值为normal.而在3中修改为full.

7 temp_store
使用2，内存模式。
pragma temp_store;
pragma temp_store = default; (0)
pragma temp_store = file; (1)
pragma temp_store = memory; (2)
查询或更改"temp_store"参数的设置。当temp_store设置为default (0),使用编译时的c预处理宏 temp_store来定义储存临时表和临时索引的位置。当设置为memory (2)临时表和索引存放于内存中。当设置为file (1)则存放于文件中。temp_store_directorypragma 可用于指定存放该文件的目录。当改变temp_store设置，所有已存在的临时表，索引，触发器及视图将被立即删除。
经测试，在类bbs应用上，通过以上调整，效率可以提高2倍以上。

六、后记
（原文后记）
写此教程，可不是一个累字能解释。
但是我还是觉得欣慰的，因为我很久以前就想写 sqlite 的教程，一来自己备忘，二而已造福大众，大家不用再走弯路。
本人第一次写教程，不足的地方请大家指出。

本文可随意转载、修改、引用。但无论是转载、修改、引用，都请附带我的名字：董淳光。以示对我劳动的肯定。

（补充后记）

SQLITE3 使用总结

2024年05月15日 • Sqlite •我要评论

相关文章:

发表评论


验证码：