分词是根据完整的单词的,不是一个完整的单词无法搜索出来的……
别一个搜索机制是字符串匹配法搜索。不过,这个肯定能搜出来,就是内容会太多。效果可能会不理想。
最近也在研究搜索这块功能。(我的问答站需要),我以后的想法是自己建一个微信公众平台。然后自己实现搜索这块。
还在摸索中,目前搜索上已经有模型了。尚需改进。分词上还在完善中……在此分享一个研究平台给大家试用。就是我的公众微信号 jhack79 加为好友后,你给我发一个句子,会自动分词后发还给你……
采用的是新浪SAE(因为我的站在SAE,不过有人测试说,如果用PHP的话,bae的节点会更快,建议有此意项同学做好跨平台准备)的分词,据说是新浪爱问的分词。经我的测试与分析,基本与中科院的分词是一样的。都有词性返回……
经过了小修改,直接返回的词性是中文…… 有此兴趣同学可以试试……。
阅读全文
收起全文