遇到问题,错误提示:抓取失败超时,抓取规则不合适或者超时时间设置太短


主题名 :深圳_2


希望大神帮我看看,希望能详细一下,谢谢




举报 使用道具
| 回复

共 6 个关于本帖的回复 最后回复于 2016-11-30 12:39

沙发
Fuller 管理员 发表于 2016-11-30 10:50:28 | 只看该作者
举报 使用道具
板凳
ym 版主 发表于 2016-11-30 10:55:47 | 只看该作者
加载规则没有报错,看不出问题,你是抓网页时超时失败,需要分析抓失败的网址与规则是否匹配,可以参考一下这篇文章操作《怎么解决规则采集失败/遗漏的问题》
举报 使用道具
地板
Fuller 管理员 发表于 2016-11-30 10:59:52 | 只看该作者
影响适应性的主要问题是使用了绝对定位,这个网页上也没有其他@class 作为定位标志。要提高适应性,用自定义xpath,选择网页内容作为定位标志,比如,“使用年限”

要么像第二个整理箱那样,做样例复制,抓取内容就是笼统的“字段名”和“字段值”,把表中所有行抓下来以后再处理
举报 使用道具
5#
zhuohui1987 金牌会员 发表于 2016-11-30 12:34:06 | 只看该作者
xml怎么转excel字段,三级
举报 使用道具
6#
Fuller 管理员 发表于 2016-11-30 12:38:34 | 只看该作者
zhuohui1987 发表于 2016-11-30 12:34
xml怎么转excel字段,三级

xml转excel的教程:http://www.gooseeker.com/doc/article-329-1.html
举报 使用道具
7#
Fuller 管理员 发表于 2016-11-30 12:39:23 | 只看该作者
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-26 13:33