官方说明:“刨丁解羊中文分词器,主要用于对网络蜘蛛或网络爬虫抓取的网页进行分词,支持繁体中文分词、简体中文分词、英文分词,是制作通用搜索引擎和垂直搜索引擎的核心组件。该软件在普通PC机器上测试显示:TXT格式正文分词速度约为3000万字/分钟,网页分词速度约为277.8个网页/秒。该软件采用基础词库(63万词语)+扩展词库(用户可手工添加新词)。DLL及OCX调用请联系QQ(601069289)。”
很小的绿色中文分词软件,我也是从网上找到的,还是足够日常中一些小场景使用,对不懂程序的同学而言,可能用这样的小软件比去想办法自学程序再去研究一套分词工具出来要干脆。当然更复杂的需求,这个可能也解决不了。
资源简介:官方说明:“刨丁解羊中文分词器,主要用于对网络蜘蛛或网络爬虫抓取的网页进行分词,支持繁体中文分词、简体中文分词、英文分词,是制作通用搜索引擎和垂直搜索引擎的核心组件。该软件在普通PC机器上测试显示:TXT格式正文分词速度约为3000万字/分钟,网页分...
上传时间: 2017-10-21
上传用户:hanboy
资源简介:庖丁解羊中文分词软件,方便绿色,解压可用
上传时间: 2016-07-27
上传用户:Telwyn
资源简介:一个简单的中文分词器,java语言描述,并附带
上传时间: 2015-09-01
上传用户:caixiaoxu26
资源简介:lucene.net 2.0的中文分词器,采用最大向前匹配算法,附上源代码和lucene.net.dll,希望这方面有兴趣的互相交流一下。
上传时间: 2013-12-25
上传用户:zhangzhenyu
资源简介:Web挖掘技术在搜索引擎中的应用与实现 介绍了PageRange , 结构挖掘器 , 页面分析器,中文分词等技术
上传时间: 2016-09-21
上传用户:wweqas
资源简介:中文分词,词频统计,绿色软件很好用的软件,解压就可以用
上传时间: 2013-05-20
上传用户:cuicuicui
资源简介:支持java的中文分词程序
上传时间: 2015-02-12
上传用户:semi1981
资源简介:用于中文分词的切分词典,还有词性标注,以这个词典数据库为基础建立文本分类,文本检索或文本过滤可以节省很多时间.很全,强烈推荐!
上传时间: 2015-03-11
上传用户:lijinchuan
资源简介:一个中文分词的实现及演示程序,可用与中文和英文词组的分割.
上传时间: 2015-04-18
上传用户:as275944189
资源简介:Delphi实现的简单中文分词,不知道大家有没有发个上来。QQ:313433524 我很菜,有谁愿意教我 感激不尽。
上传时间: 2014-01-02
上传用户:dianxin61