快捷导航
5 60

下载文件问题

jiangsuxincheng 于 2017-7-17 14:41 发表 [复制链接]
我想采集这个网站内容:http://wenshu.court.gov.cn/list/ ... :%E6%B7%AE%E5%AE%89。最主要是每一个案件右下角下载标志下载的内容 4.png
首先每一个文件都是word的形式,我做了一个连续动作点击的规则,规则名裁判下载1,然后爬数据,可是点了下出现图片形式, 3.png 按道理说点击保存文件下面(以后自动采用相同的动作处理类似文件),可是为何这个根本就点不了了,是否我哪里规则做错了
举报 使用道具
| 回复

共 5 个关于本帖的回复 最后回复于 2017-7-17 15:23

shengchengx 高级会员 发表于 2017-7-17 14:46:14 | 显示全部楼层
勾上那个以后自动才用相同的动作处理此类文件,如果上面选择不了的话就只能手动点击保存了。
举报 使用道具
jiangsuxincheng 初级会员 发表于 2017-7-17 14:57:18 | 显示全部楼层
能否请你帮我测试看看是浏览器设置问题还是文件本身不允许勾上了
举报 使用道具
shengchengx 高级会员 发表于 2017-7-17 15:03:15 | 显示全部楼层
jiangsuxincheng 发表于 2017-7-17 14:57
能否请你帮我测试看看是浏览器设置问题还是文件本身不允许勾上了

不能勾选呢,而且你这个xpath找的有问题呢,这个只会点击第一个下载呢,后面的就不会点击了
TIM截图20170717150113.png
举报 使用道具
jiangsuxincheng 初级会员 发表于 2017-7-17 15:15:31 | 显示全部楼层
这个有没有其他办法采集了,我主要采集网页内容和每个下载文件
举报 使用道具
shengchengx 高级会员 发表于 2017-7-17 15:23:38 | 显示全部楼层
jiangsuxincheng 发表于 2017-7-17 15:15
这个有没有其他办法采集了,我主要采集网页内容和每个下载文件

没呢,如果不能进行勾选自动的话,就只能手动点击保存呢。
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 深圳市咨询投诉分析
  • 去资源库下载规则,轻松抓数据
  • 下载安装Gooseeker爬虫软件
  • 【第60期】集搜客爬虫入门
  • 爬虫能做什么?

热门用户

集搜客GooSeeker网络爬虫 ( 粤ICP备11065265号-2 )

GMT+8, 2017-7-25 18:37