集搜客GooSeeker网络爬虫

标题: 下一页标志显示不对,怎么设置翻页,帮忙看一下 [打印本页]

作者: tangtang1234    时间: 2021-10-12 13:35
标题: 下一页标志显示不对,怎么设置翻页,帮忙看一下
任务名称:中国园林企业页

作者: gz51837844    时间: 2021-10-12 14:43
这个页面每一页有独立网址,所以也可以不用翻页,直接把网址构造好添加进去:
https://www.yuanlin.com/114/2/1.html
https://www.yuanlin.com/114/2/2.html
https://www.yuanlin.com/114/2/3.html
https://www.yuanlin.com/114/2/4.html
.。。。。。。

作者: wangyong    时间: 2021-10-12 14:48
[attach]14996[/attach]可以用连续动作中的点击动作来翻页,xpath是:

  1. //*[@class='dq_cbox1']/p/a[last()-1]
复制代码
再将高级设置中的重复执行次数修改为3238


作者: gz51837844    时间: 2021-10-12 14:51
普通的翻页也是可以的,需要找个有@class或者@id值的节点做翻页区映射,翻页设置那里勾选“完全匹配标志值”:
[attach]14997[/attach]

作者: tangtang1234    时间: 2021-10-12 14:59
gz51837844 发表于 2021-10-12 14:51
普通的翻页也是可以的,需要找个有@class或者@id值的节点做翻页区映射,翻页设置那里勾选“完全匹配标志值 ...

翻页标志那个8不用管它对吗?只把那个class做翻页区新建,是这样吗

作者: gz51837844    时间: 2021-10-12 15:07
tangtang1234 发表于 2021-10-12 14:59
翻页标志那个8不用管它对吗?只把那个class做翻页区新建,是这样吗

是的,我测试是OK的,你可以把翻页区和翻页标志映射都重新做一下

作者: tangtang1234    时间: 2021-10-12 15:08
tangtang1234 发表于 2021-10-12 14:59
翻页标志那个8不用管它对吗?只把那个class做翻页区新建,是这样吗

我晕了,晕了,一级需要添加网址的,知道了知道了,谢谢

作者: tangtang1234    时间: 2021-10-12 15:12
tangtang1234 发表于 2021-10-12 15:08
我晕了,晕了,一级需要添加网址的,知道了知道了,谢谢

帮忙看一下现在的任务设置的可以吗、

作者: tangtang1234    时间: 2021-10-12 15:13
tangtang1234 发表于 2021-10-12 15:12
帮忙看一下现在的任务设置的可以吗、

网页一直不懂

作者: tangtang1234    时间: 2021-10-12 15:13
gz51837844 发表于 2021-10-12 15:07
是的,我测试是OK的,你可以把翻页区和翻页标志映射都重新做一下

帮忙再看一眼,网页一直不动

作者: wangyong    时间: 2021-10-12 15:33
tangtang1234 发表于 2021-10-12 15:13
帮忙再看一眼,网页一直不动

你用我发的方法采集,这个测试可以成功采






欢迎光临 集搜客GooSeeker网络爬虫 (https://www.gooseeker.com/doc/) Powered by Discuz! X3.2