抓取信息规则不适用 规则名是:科技政策汇文章内容
举报 使用道具
| 回复

共 1 个关于本帖的回复 最后回复于 2018-4-18 22:39

沙发
Fuller 管理员 发表于 2018-4-18 22:39:54 | 只看该作者
加载你的规则是没有问题的,你采集的网页是大块的文字,这样的网页的模版不够严格,可能每个网页都有些不同。你可以采用加载失败线索加以分析的方法,找出来失败在那个抓取内容上,这个抓取内容在这个网页上的定位和样本页面上的有什么不同,就是比较两个网页上,这个抓取内容的XPath有什么不同,根据不同编写自定义xpath
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-24 02:53