【资源属性】:
           资源名称:多讯php中文分词扩展 v0.1
           资源大小:1.4KB
           资源类别:            源码下载                       》             php源码                        
           更新时间:2021-06-24
           资源语言:简体中文
           授权方式:免费下载
           使用平台:Windows/Linux/Mac
                                                                                                                       


资源介绍:                            专业提供中文分词PHP扩展和中文词库。使中文分词,全文搜索不再是难点,一个php函数即完成分词。然后即可把分词后的结果存储,再使用sphinx,Lucene等进行索引搜索了。

安装说明

1。 若服务器为Windows系统,复制PHP扩展包中php_duoxun5.dll到php安装
目录下ext文件夹中(默认为此位置,具体以php.ini中extension_dir定义位
置为准)
2。 若服务器为Linux系统,复制PHP扩展包中duoxun5.so到php安装目录下
lib/php/extensions/no-debug-non-zts-20060613/文件夹或
lib/php/extensions/no-debug-non-zts-20090626/文件夹中(具体以php.ini
中extension_dir定义位置为准)
3。 编辑php.ini,添加extension=php_duoxun5.dll(Windows)或
extension="php_duoxun5.so"(Linux)
4。 重启Web服务。
5。 下载中文词库,并上传到服务器(任何位置均可)
6。 中文分词交流QQ群:37523749。若有疑问或需要帮助,请加群交流讨论。

使用说明 1。
在phpinfo()显示页面查找到如下图信息,则表示PHP扩展安装成功


2。
演示代码,如下图



显示结果,如下图



参数:函数duoxun_fenci(),共三个参数。第一个参数:要进行分词的语句,第二个参数:多讯中文词库路径,

第三个是否进行一元分词,该参数可选,默认值为0,即不进行一元分词。

建议:对添加到数据库的分词包含一元分词然后进行索引,然后对要查询的词语先进行不包含一元分词的分词

(使搜索结果更精准),若没有搜索到查询记录,再进行包含一元分词的分词,再查询一次(以便在词库没有某

词语,也能搜索到结果,但可能无用信息会比较多)。
3。
OK,中文分词就这样简单。现在可以把分词后的结果存入数据库,然后使用sphinx,Lucene等进行索引并搜索了。

资源标签:                                 扩展                                中文分词                                php