11#
qingmu888 中级会员 发表于 2016-11-9 16:29:38 | 只看该作者
xandy 发表于 2016-11-9 16:01
规则是要多做调试的,结合修改定位或者自定义xpath,再看看你的最优采集规则是哪个
...

奥奥,我还想请教一下你个问题,今天出现了这种问题:上午爬数据,,部分网页抓取出错,后续分析会出现“无法定位容器 No.0”情况,但是下午相同的链接和规则,又可以抓到一部分网页的信息,但是还是有一些不行,请问这是个什么情况,(PS:这个规则我昨天也用过,没有问题的,可以抓到所有的 有天猫双十一狂欢价的宝贝,今天改变了一些链接而已,但是网页结构是没有变化的)
求解答
举报 使用道具
12#
Fuller 管理员 发表于 2016-11-9 16:41:06 | 只看该作者
qingmu888 发表于 2016-11-9 16:29
奥奥,我还想请教一下你个问题,今天出现了这种问题:上午爬数据,,部分网页抓取出错,后续分析会出现“无 ...

容器节点已经做了定位标志映射,如果还出现这个问题,就可以对比一下这两个网页在划定范围的时候,这个class是否有变化,比如,class名字可能有些细微的变化。

以前的MS谋数台版本,不运行同时运行两个以上的窗口。现在可以用GS爬虫浏览器,点击工具条中央的“定义规则”,每个浏览器窗口都可以定义规则,可以把两个进行对比
举报 使用道具
13#
Fuller 管理员 发表于 2016-11-9 16:43:00 | 只看该作者
qingmu888 发表于 2016-11-9 15:19
你好,我用你的方式试了,本来815条链接,用绝对定位,专柜价抓空了15个,改为这种地位标志映射后,抓空了 ...

很可能是不同网页的定位标志有细微的变化。如果有细微的变化,即使用自动找到的定位标志也可能受影响。一种方法是:在DOM树上再往祖先节点方向找,找个各网页都一样的标志
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 360或火绒等杀毒软件导致GooSeeker爬虫软件
  • 话题分析(NMF模型和LDA模型)软件的安装和
  • 运行Apple无法验证的程序的方法
  • 文本聚类分析软件的安装和使用方法
  • 利用AI阅读和分析文本:扣子COZE记录用户反

热门用户

GMT+8, 2025-4-28 23:04