在做层级练习,遇到问题,错误提示:抓取失败超时,抓取规则不合适或者超时时间设置太短
主题名:jd.com-1
主题名:jd.com-1
希望大神帮我看看,谢谢
举报 使用道具
| 回复

共 3 个关于本帖的回复 最后回复于 2016-11-15 11:24

沙发
Fuller 管理员 发表于 2016-10-14 20:38:59 | 只看该作者
要用上定位标志映射,但是要注意避开陷阱



用红色的定位标志,但是不用蓝色的,因为蓝色的@class里面含有商品唯一的商品编号 3355143,要是用上的话,别的商品不一样,规则就失效了。、


做了定位标志映射以后,得到的规则是这样子的




红色显示的表达式比较短,对比没有做定位标志映射的,是这样子的



表达式很长,而且里面有很多position()函数,这种是明确规定网页节点的位置,网页内容稍微变化,编号就变化了。
举报 使用道具
板凳
Fuller 管理员 发表于 2016-10-14 20:43:25 | 只看该作者
总之,网页上的唯一性的标志或者结构要避开,点击“测试”按钮后,输出窗口中转到“数据规则”页签,可以观察一下选择的标志
举报 使用道具
地板
Fuller 管理员 发表于 2016-11-15 11:24:14 | 只看该作者
关于提高适应性的一个全面总结《提高规则适应性的方法有哪些?
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-25 05:10