中文自动分类。使用spider抓取网络信息,利用lucene的分词及KNN方法。
/dl/409811.html
标签: spider 自动 分类 网络信息
上传时间: 2017-02-28
上传用户:yyq123456789
该源码用c++编写,实现了中文分词的功能。
/dl/417126.html
标签: 源码 编写
上传时间: 2014-01-21
上传用户:wang0123456789
汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),该系统的功能有:中文分词;词性标注;未登录词识别。分词正确率高达97.58 (973专家组评测),未登录词识别召回率均高于90 ,其中中国人名的识别召回率接近98 处理速度为31.5Kbytes/s。ICTCLAS的特色还在于:可以根据需要输 ...
/dl/421599.html
标签: Technology Computing Institute Analysis
上传时间: 2013-12-24
上传用户:ANRAN
汉化CLucene今天,把CLucene的程序改了一下,可以支持汉字了·1·在vc6编译2·还不支持分词,但支持汉字,
/dl/436238.html
标签: CLucene 汉化
上传时间: 2014-11-26
上传用户:qq21508895
关于中文中词语搭配的三篇论文,利用语义间的信息消解分词中的歧义问题,希望能给研究分词消歧的人一些帮助,谢谢!
/dl/438580.html
标签: 论文
上传时间: 2017-05-11
上传用户:笨小孩
用java语言实现文本聚类,包括聚类前的数据预处理:分词、降维、建立向量空间模型等
/dl/440948.html
标签: java 语言 文本聚类
上传时间: 2014-11-18
上传用户:zhoujunzhen
自己下载一个语料库,根据程序,计算权重,然后对语料库进行分词
/dl/458599.html
标签:
上传时间: 2014-01-25
上传用户:zhangliming420
CRF工具包,最新版,windows下使用,已编译好可直接使用。分词,特征选择,机器学习
/dl/468857.html
标签: CRF 工具包
上传时间: 2017-07-23
上传用户:zhengjian
一个的文本分割程序,采用了改变的最大长度切分结合统计分词方法。
/dl/471862.html
标签: 分割 程序
上传时间: 2014-01-04
上传用户:woshiayin
将整段汉字,转化为拼音,并且实现自动分词
/dl/484515.html
标签: 汉字
上传时间: 2017-09-01
上传用户:417313137
虫虫下载站 半导体技术网 电子研发网 源码地带 电源技术网 单片机技术网 医疗电子技术 嵌入式系统与单片机