|
我是这样做的
1,第一级规则的连续动作:只定义点击动作
假设要点击19次,那么就这么写 //div[@class='truck-item' and position() < 20]//*[@class='title']
如果想点击100次,那么就这么写 //div[@class='truck-item' and position() < 101]//*[@class='title']
用position()函数控制点击次
2,第二级做回退动作
注意,目标主题虚构了一个,按理说应该回退以后再次把主题名变成第一级,但是目前版本在这里这种环回的时候有点问题
对于虚构的主题名,做完动作以后发现没有抓取规则就只做回退,不往前走了,刚好达到目的
3,crontab规定滚屏次数
scrollWindowRatio = 2
scrollMorePages = 20
如果第二个红框的主题是第二级的,那么就不能要,第二级主题不用出现,因为是连续动作,一口气执行到底的
scrollMorePages只能控制一个大概,=20的话,一般滚屏次数会大于20次
这样就能实现你要求的抓取模式
|
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有帐号?立即注册
x
|