Plume v0.5.0后对中文搜索支持大副提升

旧版本Plume在搜索时只按空格识别词语,因此中文只能搜索完整短句。在0.5.0版本后,Plume增加了搜索模式的设定,可以按字词搜索,最低划分单位为2个字,最高为8个。也就是说,到此时才是真正意义上支持了中文搜索。

Plume的搜索功能非常强大,支持高级搜索,但原先由于其只支持按照空格分词,因此对中文搜索的支持几乎是聊胜于无。但升级至0.5.0版本后,在配置文件中增加了SEARCH_CONTENT_TOKENIZERSEARCH_TAG_TOKENIZER两个参数,修改其为ngram并且重新编译搜索索引之后,Plume搜索即可支持最低2个字,最高8个字的中文词组,词汇严格按照前后顺序,这一点甚至比Mastodon更适合中文(Mastodon将每个中文字判定为一个词,搜索某中文词需要加英文双引号)。

当然这样做也产生了副作用:对英文单词的搜索变得很诡异,只要超过8个字母的英语单词都无法搜索,只能将其减少到8个字母以下,或者在中间加空格将每一部分减到8字母内。举例:在本站用“registeration”无法搜索,但是用“regist”这样的字母组合可以。

具体可以参考这个issue

看了下,KitaitiMakoto这位日本开发者最近似乎抽出了空,不仅开发进度有大副提升,日文/中文用户的使用体验也改善了许多。稳定性在0.5.0的拉胯之后,在0.6.1-dev版本似乎又变好了,期待Plume未来能够真正成为互联互通的优秀博客平台。