第一步:操作在source里面
Coreseek-3.2.14与4.0.1更新
http://www.coreseek.cn/news/12/99/
增加sql_query_info_pre指令:
#索引数据前,设置正确的字符集
sql_query_pre
#查询数据库,获取需要索引的数据
sql_query
......
#命令行查询时,设置正确的字符集
sql_query_info_pre
#命令行查询时,从数据库读取原始数据信息
sql_query_info
第二步:操作在index里面
coreseek默认安装时,即csft.conf中的charset_type
1.首先复制mmseg源代码中的data文件夹到你的mmseg的安装目录中,可以不这么做,但是data目录必须有。
#
2.然后进入刚才的路径,生成字典文件
#cd
#
会生成一个unigram.txt.uni文件,将这个文件改名或者复制为uni.lib在当前文件夹
#
3.现在修改csft.conf文件
#
查找charset_type并修改为:
charset_type
同时添加一行:
charset_dictpath
现在向默认的mysql数据库中插入一条中文信息。注意需要utf8_general_ci编码。
4.重建索引
/usr/local/coreseek/bin/indexer
a.--rotate参数可以在不停searchd的情况下索引,不然会提示错误
b.如果出现
解决办法
#vi
输入以下
[mmseg]
merge_number_and_ascii=1;
number_and_ascii_joint=-;
compress_space=0;
seperate_number_ascii=1;
解释如下