我有个网站要抓取,网站应该是ajax的模式,网址始终不变。有一个下拉选择框,列表中选择后,下面有个表格会重新Load。

我已经做好了2级抓取,也能抓取到表格中的数据。

现在的问题是,在下拉列表中,由于看不到网址的信息,所以转做用连续动作。

连续动作,使用了样例复制来取下拉选择框的数值。同时设置连续动作来模拟点击,但也是无法触发2级规则的抓取。
.//*[@class='plx-filter-select-item unselected']/@data-ng-click

请帮忙看下,是否连续动作设置的有问题。


举报 使用道具
| 回复

共 1 个关于本帖的回复 最后回复于 2016-10-28 11:34

沙发
xandy 论坛元老 发表于 2016-10-28 11:34:40 | 只看该作者
本帖最后由 xandy 于 2016-10-28 11:35 编辑

连续动作中选择下拉框的XPATH定位到SELECT,然后爬虫会自动执行循环(依次选择OPTION里头的值)
不是用样例复制来取下来选择框的数值,取下拉框里头的值参看这篇教程《怎么抓取下拉菜单被选择项的值
另外,下拉选择框不能定位到具体的OPTION值,不然会导致连续动作失败
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 360或火绒等杀毒软件导致GooSeeker爬虫软件
  • 话题分析(NMF模型和LDA模型)软件的安装和
  • 运行Apple无法验证的程序的方法
  • 文本聚类分析软件的安装和使用方法
  • 利用AI阅读和分析文本:扣子COZE记录用户反

热门用户

GMT+8, 2025-4-28 17:08