我想采集这个网站内容:http://wenshu.court.gov.cn/list/ ... :%E6%B7%AE%E5%AE%89。最主要是每一个案件右下角下载标志下载的内容
首先每一个文件都是word的形式,我做了一个连续动作点击的规则,规则名裁判下载1,然后爬数据,可是点了下出现图片形式, 按道理说点击保存文件下面(以后自动采用相同的动作处理类似文件),可是为何这个根本就点不了了,是否我哪里规则做错了
举报 使用道具
| 回复

共 5 个关于本帖的回复 最后回复于 2017-7-17 15:23

沙发
shengchengx 金牌会员 发表于 2017-7-17 14:46:14 | 只看该作者
勾上那个以后自动才用相同的动作处理此类文件,如果上面选择不了的话就只能手动点击保存了。
举报 使用道具
板凳
jiangsuxincheng 初级会员 发表于 2017-7-17 14:57:18 | 只看该作者
能否请你帮我测试看看是浏览器设置问题还是文件本身不允许勾上了
举报 使用道具
地板
shengchengx 金牌会员 发表于 2017-7-17 15:03:15 | 只看该作者
jiangsuxincheng 发表于 2017-7-17 14:57
能否请你帮我测试看看是浏览器设置问题还是文件本身不允许勾上了

不能勾选呢,而且你这个xpath找的有问题呢,这个只会点击第一个下载呢,后面的就不会点击了

举报 使用道具
5#
jiangsuxincheng 初级会员 发表于 2017-7-17 15:15:31 | 只看该作者
这个有没有其他办法采集了,我主要采集网页内容和每个下载文件
举报 使用道具
6#
shengchengx 金牌会员 发表于 2017-7-17 15:23:38 | 只看该作者
jiangsuxincheng 发表于 2017-7-17 15:15
这个有没有其他办法采集了,我主要采集网页内容和每个下载文件

没呢,如果不能进行勾选自动的话,就只能手动点击保存呢。
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-20 00:53