搞定MySQL数据库中文模糊检索问题
时间:2008-04-01 来源:剑心通明
在 MySQL下,在进行中文模糊检索时,经常会返回一些与之不相关的记录,如查找 "%a%" 时,返回的可能有中文字符,却没有a字符存在。本人以前也曾遇到过类似问题,经详细阅读MySQL的Manual,发现可以有一种方法很方便的解决并得到满意的结果。 (Wy6`I!
1PZS b<My
例子: X4w<O=+u
=M`/-c
希望通过“标题”对新闻库进行检索,关键字可能包含是中英文,如下SQL语句: }fOR7J'
L$;uGwK
QUOTE: ]" rw+Tp
select id,title,name from achech_com.news where title like '%a%' /#BfeH,-S
Y"t5Bke^-
sa;1MKD
返回的结果,某些title字段确定带了“a”关键字,而有些则只有中文,但也随之返回在检索结果中。 .LX2o#O1
&' Eb qF
解决方法,使用 BINARY 属性进行检索,如: J,<3}*~&j
^UwEPgV:x
QUOTE: Bj,0XC
select id,title,name from achech_com.news where binary title like '%a%' DruM=Nls[
-^qy)&
W@}mt
返回的结果较之前正确,但英文字母区分大小写,故有时在检索如“Achech”及“achech”的结果是不一样的。知道了使用 BINARY 属性可以解决前面这个问题,再看看 MySQL 支持的UCASE 及 CONCAT 函数,其中 UCASE 是将英文全部转成大写,而CONCAT函数的作用是对字符进行连接,以下是我们完全解决后的SQL 语句: C}Pe\oLB
'|V 0b< G
QUOTE: #)]a5[k{{
select id,title,name from achech_com.news @'d9z0x3
where binary ucase(title) like concat('%',ucase('a'),'%') Z7c\G*}d
['li!m$
vt_h4S KQ
检索的步骤是先将属性指定为 BINARY ,以精确检索结果,而被 like 的 title内容存在大小写字母的可能,故先使用 ucase 函数将字段内容全部转换成大写字母,然后再进行 like 操作,而 like 的操作使用模糊方法,使用 concat的好处是传进来的可以是直接的关键字,不需要带“%”万用符,将“'a'”直接换成你的变量,在任何语言下都万事无忧了。 当然你也可以这么写: 4TA#s-0>
n)*]cC)#k
QUOTE: e}4n,M+
select id,title,name from achech_com.news where binary ucase(title) like ucase('%a%') cpPKsZM)K(
*Z/\e-,
nB$K""B
检索的结果还算满意吧,不过速度可能会因此而慢N毫秒。
1PZS b<My
例子: X4w<O=+u
=M`/-c
希望通过“标题”对新闻库进行检索,关键字可能包含是中英文,如下SQL语句: }fOR7J'
L$;uGwK
QUOTE: ]" rw+Tp
select id,title,name from achech_com.news where title like '%a%' /#BfeH,-S
Y"t5Bke^-
sa;1MKD
返回的结果,某些title字段确定带了“a”关键字,而有些则只有中文,但也随之返回在检索结果中。 .LX2o#O1
&' Eb qF
解决方法,使用 BINARY 属性进行检索,如: J,<3}*~&j
^UwEPgV:x
QUOTE: Bj,0XC
select id,title,name from achech_com.news where binary title like '%a%' DruM=Nls[
-^qy)&
W@}mt
返回的结果较之前正确,但英文字母区分大小写,故有时在检索如“Achech”及“achech”的结果是不一样的。知道了使用 BINARY 属性可以解决前面这个问题,再看看 MySQL 支持的UCASE 及 CONCAT 函数,其中 UCASE 是将英文全部转成大写,而CONCAT函数的作用是对字符进行连接,以下是我们完全解决后的SQL 语句: C}Pe\oLB
'|V 0b< G
QUOTE: #)]a5[k{{
select id,title,name from achech_com.news @'d9z0x3
where binary ucase(title) like concat('%',ucase('a'),'%') Z7c\G*}d
['li!m$
vt_h4S KQ
检索的步骤是先将属性指定为 BINARY ,以精确检索结果,而被 like 的 title内容存在大小写字母的可能,故先使用 ucase 函数将字段内容全部转换成大写字母,然后再进行 like 操作,而 like 的操作使用模糊方法,使用 concat的好处是传进来的可以是直接的关键字,不需要带“%”万用符,将“'a'”直接换成你的变量,在任何语言下都万事无忧了。 当然你也可以这么写: 4TA#s-0>
n)*]cC)#k
QUOTE: e}4n,M+
select id,title,name from achech_com.news where binary ucase(title) like ucase('%a%') cpPKsZM)K(
*Z/\e-,
nB$K""B
检索的结果还算满意吧,不过速度可能会因此而慢N毫秒。
相关阅读 更多 +