您现在的位置是:源码地带 > 资源下载

网页是组成互联网的基本数据单元

  • 上传时间: 2017-06-19
  • 上传用户:haowfei
  • 资源积分:2 下载积分
  • 标      签: 互联网 数据单元

资 源 简 介

网页是组成互联网的基本数据单元,是各种面向互联网的应用系统最原始的数据源。网页内部含有大量噪音信息,如何从网页中有效地提取有价值的内容成为影响数据处理效果的关键。 网页正文提取指的是从原始网页中精确地提取出正文文本,比如提取新闻网页中的报道内容。能否高效地提取出网页的正文

相 关 资 源