又找了一个比较好用的中文分词类,试用了一下,比上面的一个好用,速度也快,支持utf8.
为什么要使用中文分词呢,之前上面的搜索框是全字匹配的,摇摇搜到自己想要的答案只能够输入和问题标题部分全字匹配的关键词,现在加了个空格分词功能有所改善了,但是一个长的句子,用户有时候是不知道怎么加空格或懒得加空格的,举个例子,用户搜“中文 建议”可以搜到两个问题,一个是:anwsion中文名有什么建议么,另一个是:强烈建议加入中文分词的搜索。但是如果用户搜“中文建议”就什么搜不到了,实际上“中文 建议”“中文的建议”“中文建议”“建议中文”这几个关键词所表达了语义是非常接近的,如果采用了分词的搜索技术以后,输入上面的一些关键词,这两个问题就都能搜的到了
阅读全文
收起全文