在做层级练习,遇到问题,错误提示:抓取失败超时,抓取规则不合适或者超时时间设置太短
主题名:jd.com-1
主题名:jd.com-1
希望大神帮我看看,谢谢
举报 使用道具
| 回复

共 3 个关于本帖的回复 最后回复于 2016-11-15 11:24

沙发
Fuller 管理员 发表于 2016-10-14 20:38:59 | 只看该作者
要用上定位标志映射,但是要注意避开陷阱



用红色的定位标志,但是不用蓝色的,因为蓝色的@class里面含有商品唯一的商品编号 3355143,要是用上的话,别的商品不一样,规则就失效了。、


做了定位标志映射以后,得到的规则是这样子的




红色显示的表达式比较短,对比没有做定位标志映射的,是这样子的



表达式很长,而且里面有很多position()函数,这种是明确规定网页节点的位置,网页内容稍微变化,编号就变化了。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
板凳
Fuller 管理员 发表于 2016-10-14 20:43:25 | 只看该作者
总之,网页上的唯一性的标志或者结构要避开,点击“测试”按钮后,输出窗口中转到“数据规则”页签,可以观察一下选择的标志
举报 使用道具
地板
Fuller 管理员 发表于 2016-11-15 11:24:14 | 只看该作者
关于提高适应性的一个全面总结《提高规则适应性的方法有哪些?
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 利用AI阅读和分析文本:扣子COZE记录用户反
  • 在网页片段内直观标注——以B站评论采集为
  • 利用AI阅读和分析文本:使用COZE建设游记文
  • 使用AI工具Kimi生成python代码为文本分析结
  • 苹果mac电脑安装集搜客网络爬虫软件失败的

热门用户

GMT+8, 2024-11-23 00:54