elasticsearch自带有中文分词,但是特别的傻,后面会做对比,在这里推荐analysis ik,用es来做全文检索工具的人员80%-90%会用这个中文分词工具,一直在更新维护。
以前搭建过二次sphinx,请参考:
sphinx mmseg mysql 中文分词
coreseek sphinx mmseg mysql 全文检索 安装 配置
这次搭建的环境:centos 6.5 x86,php 5.3.3,mysql 5.5.8,三次搭建各不相同
上次搞全文检索的东西 ,还要追溯到2010了,当时个人觉得coreseek还不成熟,就用了原始的sphinx,请参考:sphinx mmseg mysql 中文分词,这次呢,决定用一下coreseek,看看有什么区别。
一、安装所需文件
mmseg-0.7.3.tar.gz 中文分词
wget http://www.coreseek.com/uploads/sources/mmseg-0.7.3.tar.gzsphinx-0.9.8-rc2.tar
mysql-5.1.7-rc.tar.gz mysql-5.1.7源代码
http://dev.mysql.com/downloads/
sphinx-0.9.8-rc2.tar.gz sphinx-0.9.8-rc2源代码
wget http://www.sphinxsearch.com/downloads/sphinx-0.9.8-rc2.tar.gz
sphinx支持分词补丁
wget http://blog.51yip.com/wp-content/uploads/2010/02/sphinx-patch.tar.gz