11#
zhuohui1987 金牌会员 发表于 2018-3-18 00:11:20 | 只看该作者
1、(小区点击2)三级规则采集查询出来的列表信息,循环三个就开始报错。

2、未能确认,(小区点击2)三级规则未能回退层数是1,回退到规则二(苏州房产查询1),假如我在(定义三级规则采集详情页的信息,同时需要用回退动作会退到二级规则中来,不过回退动作需要旗舰版以上才有回退动作是定义在三级规则中,用于回退到规则二,回退层数是1,目标主题名对应二级规则名,则小区点击2的室号采集不了数据)
3、(苏州房产1 )不能连续动作的xpath不要使用绝对定位
举报 使用道具
12#
Fuller 管理员 发表于 2018-3-18 09:58:50 | 只看该作者
zhuohui1987 发表于 2018-3-18 00:11
1、(小区点击2)三级规则采集查询出来的列表信息,循环三个就开始报错。

2、未能确认,(小区点击2)三级 ...

小区点击2 中定义的连续动作是回退,回退的目标主题名应该是 小区点击1
举报 使用道具
13#
Fuller 管理员 发表于 2018-3-18 10:14:05 | 只看该作者
我测试了,运行还好。注意,不能在DS打数机上设置 重复内容中断,因为有回退,一定会采集到重复内容。
举报 使用道具
14#
zhuohui1987 金牌会员 发表于 2018-3-18 10:27:33 | 只看该作者
Fuller 发表于 2018-3-18 10:14
我测试了,运行还好。注意,不能在DS打数机上设置 重复内容中断,因为有回退,一定会采集到重复内容。
...


一到这边就已经采集完成,结束了

,终点标志 未打勾  重复内容
举报 使用道具
15#
Fuller 管理员 发表于 2018-3-18 10:30:14 | 只看该作者
zhuohui1987 发表于 2018-3-18 10:27
一到这边就已经采集完成,结束了

,终点标志 未打勾  重复内容

DS打数机日志里面有什么提示?我这边运行很好
举报 使用道具
16#
Fuller 管理员 发表于 2018-3-18 10:38:42 | 只看该作者
有个问题要解决



当运行到这里时,在这里应该从小区点击1 返回到 苏州房产查询1,但是没有办法返回,因为在这里做完所有的点击,也做完所有的翻页以后,程序以为应该回到了 苏州房产查询1 网页,但是不是。


因为没有条件判断功能,在这里只能用相同主题名下定义多个规则完成条件判断。在这个网页上,一判断有“返回”链接,就执行 苏州房产查询1的第二个规则。在这个规则中,点击“返回”,目标主题名是 苏州房产1 ,因为返回执行后,页面又变成查询页面了
举报 使用道具
17#
zhuohui1987 金牌会员 发表于 2018-3-18 14:49:18 | 只看该作者
Fuller 发表于 2018-3-18 10:38
有个问题要解决

不行,不报错误,采集到228就结束
举报 使用道具
18#
wangyong 版主 发表于 2018-3-18 16:03:09 | 只看该作者
写xpath从228后开始采
举报 使用道具
19#
wangyong 版主 发表于 2018-3-18 16:08:24 | 只看该作者
点到228把所以规则都加载上,分析和其他网页的区别
举报 使用道具
20#
zhuohui1987 金牌会员 发表于 2018-3-19 09:27:59 | 只看该作者
wangyong 发表于 2018-3-18 16:08
点到228把所以规则都加载上,分析和其他网页的区别

主题:小区点击1 (规则二),我做一个判断“返回”的,现在失效,  

注意考虑问题“返回”总是返回到([size=13.3333px]主题:苏州房产1),做这个返回要考虑到 翻页到下一页采集完成,应该返回“[size=13.3333px]主题:苏州房产查询1
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-5 07:06