资源名称:多讯php中文分词扩展 v0.1
资源大小:1.4KB
资源类别: 源码下载 》 php源码
更新时间:2021-06-24
资源语言:简体中文
授权方式:免费下载
使用平台:Windows/Linux/Mac
安装说明
1。 若服务器为Windows系统,复制PHP扩展包中php_duoxun5.dll到php安装
目录下ext文件夹中(默认为此位置,具体以php.ini中extension_dir定义位
置为准)
2。 若服务器为Linux系统,复制PHP扩展包中duoxun5.so到php安装目录下
lib/php/extensions/no-debug-non-zts-20060613/文件夹或
lib/php/extensions/no-debug-non-zts-20090626/文件夹中(具体以php.ini
中extension_dir定义位置为准)
3。 编辑php.ini,添加extension=php_duoxun5.dll(Windows)或
extension="php_duoxun5.so"(Linux)
4。 重启Web服务。
5。 下载中文词库,并上传到服务器(任何位置均可)
6。 中文分词交流QQ群:37523749。若有疑问或需要帮助,请加群交流讨论。
使用说明 1。
在phpinfo()显示页面查找到如下图信息,则表示PHP扩展安装成功
2。
演示代码,如下图
显示结果,如下图
参数:函数duoxun_fenci(),共三个参数。第一个参数:要进行分词的语句,第二个参数:多讯中文词库路径,
第三个是否进行一元分词,该参数可选,默认值为0,即不进行一元分词。
建议:对添加到数据库的分词包含一元分词然后进行索引,然后对要查询的词语先进行不包含一元分词的分词
(使搜索结果更精准),若没有搜索到查询记录,再进行包含一元分词的分词,再查询一次(以便在词库没有某
词语,也能搜索到结果,但可能无用信息会比较多)。
3。
OK,中文分词就这样简单。现在可以把分词后的结果存入数据库,然后使用sphinx,Lucene等进行索引并搜索了。
资源标签: 扩展 中文分词 php