1、基於Trie樹切詞優勢是利用了Trie樹的字符串檢索的特性,在分詞中無須知道詞語長度,按照樹的某個節點往下匹配直到遇到結束位置就可以了;劣勢是構造詞典比較復雜。
2、整詞二分切詞優勢是速度快,通過構建收字散列表的hash定位和詞索引表,查詢速度快。劣勢是精度低。
3、逐字二分切詞優勢是融合了整詞二分的存儲優勢與Trie樹的查詢優勢。精度高,逐字匹配,不會出現歧義。