集搜客GooSeeker网络爬虫

标题: 无法有效翻页 [打印本页]

作者: xs_zhang    时间: 2016-5-1 00:17
标题: 无法有效翻页
这个网站:
http://www.51tuodao.com/front/invest/index
只能翻到第二页,后续无法进行,日志显示:
Fail to evaluate xpath: error code is 2153447475. count([count(./)>0])>0

不知是何原因,求解答。

谢谢!
作者: Fuller    时间: 2016-5-1 09:59
用记号线索类型做翻页规则,应该很好处理,我生成的是  //*[@class='list_main_paging tcdPageCode']//a[.//text()="下一页>"]

另外,我发现翻页区是动态加载的,一定要在DS打数机上设置滚屏参数,菜单 配置-〉滚屏参数,把滚屏次数设置成大于0的,比如,3-5之间的数字
作者: xs_zhang    时间: 2016-5-1 10:58
大神,按照您的建议,设置了滚屏参数为5,记号类线索与您的一样,还是出现我说的问题,日志错误信息依旧。

是否还有解决办法?
作者: Fuller    时间: 2016-5-1 11:39
xs_zhang 发表于 2016-5-1 10:58
大神,按照您的建议,设置了滚屏参数为5,记号类线索与您的一样,还是出现我说的问题,日志错误信息依旧。
...

抓取规则名字是什么?
作者: xs_zhang    时间: 2016-5-1 11:58
抓取规则是”拓道金服“,我把二级线索选项删除就可以翻页,二级线索还没做,是这个原因吗?多谢!
作者: Fuller    时间: 2016-5-1 12:17
我看了抓取规则,没有问题,而是这个网页上有很多js代码,一直在运行,所以,一直要等到超时才翻页,你可以把定时器触发打开,在DS的菜单 “工具”中
作者: xs_zhang    时间: 2016-5-1 13:13
多谢大神!




欢迎光临 集搜客GooSeeker网络爬虫 (https://www.gooseeker.com/doc/) Powered by Discuz! X3.2