集搜客GooSeeker网络爬虫
标题:
有关下拉列表的模拟点击问题
[打印本页]
作者:
cacique_sz
时间:
2016-10-28 10:02
标题:
有关下拉列表的模拟点击问题
我有个网站要抓取,网站应该是ajax的模式,网址始终不变。有一个下拉选择框,列表中选择后,下面有个表格会重新Load。
我已经做好了2级抓取,也能抓取到表格中的数据。
现在的问题是,在下拉列表中,由于看不到网址的信息,所以转做用连续动作。
连续动作,使用了样例复制来取下拉选择框的数值。同时设置连续动作来模拟点击,但也是无法触发2级规则的抓取。
.//*[@class='plx-filter-select-item unselected']/@data-ng-click
请帮忙看下,是否连续动作设置的有问题。
作者:
xandy
时间:
2016-10-28 11:34
本帖最后由 xandy 于 2016-10-28 11:35 编辑
连续动作中选择下拉框的XPATH定位到SELECT,然后爬虫会自动执行循环(依次选择OPTION里头的值)
不是用样例复制来取下来选择框的数值,取下拉框里头的值参看这篇教程《
怎么抓取下拉菜单被选择项的值
》
另外,下拉选择框不能定位到具体的OPTION值,不然会导致连续动作失败
欢迎光临 集搜客GooSeeker网络爬虫 (https://www.gooseeker.com/doc/)
Powered by Discuz! X3.2