gaojingsong的博客 -凯发k8国际

`
gaojingsong
  • 浏览: 1124910 次
  • 性别:
  • 来自: 深圳
博主相关
  • 博客
  • 微博
  • 相册
  • 收藏
  • 文章分类
    社区版块
    • ( 4)
    • ( 0)
    • ( 80)
    存档分类
    最新评论
    文章列表
    1.项目中需要对敏感词做一个过滤,首先有几个方案可以选择: a.直接将敏感词组织成string后,利用indexof方法来查询。 b.传统的敏感词入库后sql查询。 c.利用lucene建立分词索引来查询。 d.利用dfa算法来进行。 首先,项目收集到的敏感词有几千条,使用a方案肯定不行。其次,为了方便以后的扩展性尽量减少对数据库的依赖,所以放弃b方案。然后lucene本身作为本地索引,敏感词增加后需要触发更新索引,并且这里本着轻量原则不想引入更多的库,所以放弃c方案。于是我们选定d方案为研究目标。   2.dfa算法简介 dfa全称为:deterministic finite ...
    global site tag (gtag.js) - google analytics
    网站地图