集搜客GooSeeker网络爬虫

标题: 有关下拉列表的模拟点击问题 [打印本页]

作者: cacique_sz    时间: 2016-10-28 10:02
标题: 有关下拉列表的模拟点击问题
我有个网站要抓取,网站应该是ajax的模式,网址始终不变。有一个下拉选择框,列表中选择后,下面有个表格会重新Load。

我已经做好了2级抓取,也能抓取到表格中的数据。

现在的问题是,在下拉列表中,由于看不到网址的信息,所以转做用连续动作。

连续动作,使用了样例复制来取下拉选择框的数值。同时设置连续动作来模拟点击,但也是无法触发2级规则的抓取。
.//*[@class='plx-filter-select-item unselected']/@data-ng-click

请帮忙看下,是否连续动作设置的有问题。



作者: xandy    时间: 2016-10-28 11:34
本帖最后由 xandy 于 2016-10-28 11:35 编辑

连续动作中选择下拉框的XPATH定位到SELECT,然后爬虫会自动执行循环(依次选择OPTION里头的值)
不是用样例复制来取下来选择框的数值,取下拉框里头的值参看这篇教程《怎么抓取下拉菜单被选择项的值
另外,下拉选择框不能定位到具体的OPTION值,不然会导致连续动作失败





欢迎光临 集搜客GooSeeker网络爬虫 (https://www.gooseeker.com/doc/) Powered by Discuz! X3.2