注:集搜客GooSeeker爬虫从V9.0.2版本开始,爬虫术语“主题”统一改为“任务”,在爬虫浏览器里先命名任务再创建规则,然后登录集搜客官网会员中心的“任务管理”里,就可以查看任务的采集执行情况、管理线索网址以及做调度设置了。 只有1,2,3,…的页码,没有翻页记号的情况就不适用记号线索做翻页了,这时候,可以通过相对线索来实现翻页,利用当前页码和下一页码的位置自动计算出下一页的位置,实现自动翻页。 使用相对线索实现翻页 1、转到爬虫路线工作台,新建相对线索 2、点击翻页区自动定位,往上层找到橙色框的翻页区对应的dom节点,本案例中翻页区节点是div[@class='pager'],右击映射给定位编号
3、点击“1”自动定位,找到对应的dom节点,右击选择线索映射->相对线索->当前位置 4、同理,选择“2”对应的dom节点映射给下一位置 |