3 8213

求抓pdf

fqzlala 于 2017-7-25 15:00 发表 [复制链接]
http://www.cyberdefensemagazine. ... ber-2015/index.html
这样的网址,如何抓里面的pdf
举报 使用道具
| 回复

共 3 个关于本帖的回复 最后回复于 2017-7-25 16:43

wangyong 版主 发表于 2017-7-25 15:43:00 | 显示全部楼层
这个链接里的PDF浏览器也可以解析,做规则时和做网页的规则方法相同
举报 使用道具
fqzlala 中级会员 发表于 2017-7-25 16:26:29 | 显示全部楼层
wangyong 发表于 2017-7-25 15:43
这个链接里的PDF浏览器也可以解析,做规则时和做网页的规则方法相同

集搜客的谋数台,打开这个网址,不能像其他浏览器正常打开,也就是没有PDF浏览器
举报 使用道具
wangyong 版主 发表于 2017-7-25 16:43:58 | 显示全部楼层
list简化.png
集搜客浏览器和其他浏览器相同

我测试的也是用集搜客浏览器,和其他浏览器一样,需要选择简化版的才能解析PDF

如果启用flash就采不了
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-3-28 18:26