当前位置: 代码网 > it编程>数据库>MsSqlserver > SQL2005CLR函数扩展 - 关于山寨索引

SQL2005CLR函数扩展 - 关于山寨索引

2024年05月18日 MsSqlserver 我要评论
本文只是一个山寨试验品,思路仅供参考. --------------------------------------------------------------------------------
本文只是一个山寨试验品,思路仅供参考.
--------------------------------------------------------------------------------
原理介绍:
索引建立
目录结构划分方案也只是很简易的实现了一下,通过unicode把任意连续的两个字符(中文或英文)分为4个字节来做四层目录,把索引的内容对应的主关键字(主要为了使用sql索引和唯一性)作为文件名,两个字符在索引内容中的位置作为文件后缀来存储.文件本身为0字节,不保存任何信息.

比如一条数据 "pk001","山寨索引"
山寨索引 四个字的unicode为
[0]: 113
[1]: 92
[2]: 232
[3]: 91
[4]: 34
[5]: 125
[6]: 21
[7]: 95
那么对应的文件结构为
../113/92/232/91/pk001 .0
../232/91/34/125/pk001 .1
../34/125/21/95/pk001 .2

索引使用
比如搜索"寨索引 "
则搜索 "../232/91/34/125/" 目录下的所有文件,然后根据 pk001 .1的文件后缀名1,去看 ../34/125/21/95/pk001.2文件是否存在.依次类推,最后返回一个结果集.
--------------------------------------------------------------------------------
实用性
具体的实用性还有待验证.这只是实现了精确的like搜索,而不能做常见搜索引擎的分词效果.另外海量数据重建索引的性能也是面临很严峻的问题,比如cpu负载和磁盘io负载.关于windows一个目录下可以保持多少个文件而不会对文件搜索造成大的性能损失也有待评估,不过这个可以考虑根据主键的文件名hash来增加文件目录深度降低单一目录下的文件数量.
--------------------------------------------------------------------------------
演示效果
实现了针对test标的name和caption两个字段作索引搜索.
 
-- 设置和获取索引文件根目录
--select dbo.xfn_setmyindexfileroot('d:/myindex')
--select dbo.xfn_getmyindexfileroot()
-- 建立测试环境
 go
create table test( id uniqueidentifier , name nvarchar ( 100), caption nvarchar ( 100))
insert into test select top 3 newid (), ' 我的索引 ' , ' 测试 ' from sysobjects
insert into test select top 3 newid (), ' 我的测试 ' , ' 索引 ' from sysobjects
insert into test select top 3 newid (), ' 测试索引 ' , ' 测试索引 ' from sysobjects
insert into test select top 3 newid (), ' 我的索引 ' , ' 索引 ' from sysobjects
create index i_testid on test( id)
-- 建立索引文件
declare @t int
select @t=
dbo. xfn_setkeyformyindex( id, 'testindex' , name + ' ' + caption)   
from test
-- 查询数据
select  a.*   from   test a, dbo. xfn_getkeyfrommyindex( '测试 索引 我的' , 'testindex' )  b
    where a. id= b. pk
/*
0c4634ea-df94-419a-a8e5-793bd5f54eed   我的索引 测试
2dd87b38-cd3f-4f14-bb4a-00678463898f   我的索引 测试
8c67a6c3-753f-474c-97ba-ce85a2455e3e   我的索引 测试
c9706bf1-fb1f-42fb-8a48-69ec37ead3e5   我的测试 索引
8bbf25cc-9dbb-4fcb-b2eb-d318e587dd5f   我的测试 索引
8b45322d-8e46-4691-961a-cd0078f1fa0a   我的测试 索引
*/
--drop table test
--------------------------------------------------------------------------------
clr代码如下:编译为myfullindex.dll

--------------------------------------------------------------------------------
部署的sql脚本如下
--drop function dbo.xfn_setmyindexfileroot
--drop function dbo.xfn_getmyindexfileroot
--drop function dbo.xfn_getkeyfrommyindex
--drop function dbo.xfn_setkeyformyindex
--drop assembly myfullindex
--go
create assembly myfullindex from 'd:/sqlclr/myfullindex.dll' with permission_set = unsafe;
--
go
-- 索引搜索
create function dbo. xfn_getkeyfrommyindex ( @word nvarchar ( max ), @indexname  nvarchar ( 900))   
returns table ( pk nvarchar ( 100))
as external name myfullindex. userdefinedfunctions. getindex
go
-- 索引建立
create function dbo. xfn_setkeyformyindex ( @pk nvarchar ( 900), @indexname  nvarchar ( 900), @word nvarchar ( max ))   
returns int
as external name myfullindex. userdefinedfunctions. setindex
go
-- 获取索引文件根目录
create function dbo. xfn_getmyindexfileroot ()   
returns nvarchar ( max )
as external name myfullindex. userdefinedfunctions. getroot
go
-- 设置索引文件根目录(默认目录为 d:/myindex )
create function dbo. xfn_setmyindexfileroot ( @fileroot nvarchar ( max ))   
returns bit
as external name myfullindex. userdefinedfunctions. setroot
go
(0)

相关文章:

版权声明:本文内容由互联网用户贡献,该文观点仅代表作者本人。本站仅提供信息存储服务,不拥有所有权,不承担相关法律责任。 如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 2386932994@qq.com 举报,一经查实将立刻删除。

发表评论

验证码:
Copyright © 2017-2025  代码网 保留所有权利. 粤ICP备2024248653号
站长QQ:2386932994 | 联系邮箱:2386932994@qq.com