将词库词与词表词进行统计,得到两者相同的部分,再找到完全不同的部分
资源简介:将词库词与词表词进行统计,得到两者相同的部分,再找到完全不同的部分
上传时间: 2015-12-26
上传用户:561596
资源简介:基于词库的中文分词组件,可以直接用于Lucene的索引建立。以及中文搜索。
上传时间: 2016-08-22
上传用户:llandlu
资源简介:是用来将掌上电脑与PC之间进行连接,并将掌上电脑的界面发送到PC上,可以通过PC观看
上传时间: 2014-11-23
上传用户:Miyuki
资源简介:输入一篇英文,程序将对里面每个单词的频率进行统计,从文件输入,而不是从键盘输入.
上传时间: 2013-12-25
上传用户:3到15
资源简介:基于正向最大匹配法的分词。采用hash表技术将一段连续的话用所给词库进行分词输出。
上传时间: 2016-06-08
上传用户:zhengjian
资源简介:...将该字符串变量与停用词表中的所有单词进行比较,若果该词在停用词表中出现过则不对其进行统计,否则在对该词进行词干抽取。 经过以上停用词、词干处理后得到的将是实际进行统计的“单词”(此时的“单词”实际上已经是所有具有相同词干的原是单词的统一...
上传时间: 2016-05-27
上传用户:tfyt
资源简介:python写的gbk分词分句程序 可以使用sogou或者谷歌输入法的词库进行分词
上传时间: 2014-01-13
上传用户:evil
资源简介:中文分词算法,效率很高,使用词典树装搜索进行单词切割,并提供扩充词库的函数!
上传时间: 2017-03-10
上传用户:xauthu
资源简介:海鹰词库编辑器 针对类似于海鹰词库的数据库的编辑器,可对数据库进行重复扫描、比较,从windows系统自带输入法码表转换数据等操作
上传时间: 2014-01-07
上传用户:爺的气质
资源简介:access中文词库,用于中文搜索,建议与lucene联系起来使用
上传时间: 2013-11-28
上传用户:songrui