本帖最后由 zhwen5668 于 2021-10-10 21:25 编辑

下载文件后,无法打开提示“请开启JavaScript并刷新该页”怎么办.

规则在此,请各位大神指点   https://www.gooseeker.com/secure/me/zhwen5668_preview/share646843.html
举报 使用道具
| 回复

共 5 个关于本帖的回复 最后回复于 2021-10-15 17:11

wangyong 版主 发表于 2021-10-9 13:59:28 | 显示全部楼层
你是用集搜客爬虫下载的?规则名发一下
举报 使用道具
Fuller 管理员 发表于 2021-10-9 15:42:10 | 显示全部楼层
定义下载文件的规则一定要注意,

方法1:要找到文件的网址,用这个网址做内容映射,然后给这个抓取内容勾上下载文件
方法2:如果找不到网址,但是可以点击某个按钮或者链接下载文件,那么就要定义点击动作

你把规则名发出来,我测试一下
举报 使用道具
zhwen5668 新手上路 发表于 2021-10-10 21:22:55 | 显示全部楼层
https://www.gooseeker.com/secure/me/zhwen5668_preview/share646843.html
举报 使用道具
gz51837844 管理员 发表于 2021-10-11 09:27:07 | 显示全部楼层
zhwen5668 发表于 2021-10-10 21:22
https://www.gooseeker.com/secure/me/zhwen5668_preview/share646843.html

这个页面上的pdf文件,使用新版爬虫软件-数据管家可以下载, 不过文件打开时报“格式错误”。这个问题我们会记录下来,在以后的版本升级中考虑适配这种页面。

我测试过,用旧版爬虫可以下载和打开,这个网站的pdf下载,你可以先使用旧版爬虫9.2.0
QQ截图20211011092153.png
举报 使用道具
zhwen5668 新手上路 发表于 2021-10-15 17:11:36 | 显示全部楼层
多谢,多谢
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-19 08:48