怎样从网页上一次性下载多个pdf文件？

发誓学好内容分析

比如这个网站：https://www.iau-aiu.net/Publications

上面有很多跟大学教育有关的政策文件，都是pdf格式的。我要下载下来，但是这些文件的链接散布在文字中，没法定义样例复制规则。

有办法像下载图片和视频那样一次下载多个pdf文件吗？

Fuller · 发表于 2022-3-12 18:43:15

集搜客数据管家V11.1.0版本才支持这个功能。定义规则的时候要注意：大部分情况下是要自定义xpath的，过程是：1. 先用包含所有pdf文件的那个网页区域做内容映射
2. 点击“测试”按钮，找到采集规则，将xpath拷贝出来进行编辑
3. 进入自定义xpath弹窗，编辑好的那个xpath作为定位xpath，再写一个内容xpath。

例如，针对这个网页，用红框的内容做内容映射，然后如下图自定义xpath。分别输入定位xpath和内容xpath的原因：用定位xpath划定一个网页区域，然后用内容xpath从这个区域中采集内容

thursdayrain · 发表于 2022-3-14 14:38:26

我试了一下，文件没有下载下来。是不是path没有写对？帮我写两个path吧
任务名：新西兰教育部_战略和政策_详情_文件下载

Fuller · 发表于 2022-3-14 14:45:07

thursdayrain 发表于 2022-3-14 14:38
我试了一下，文件没有下载下来。是不是path没有写对？帮我写两个path吧
任务名：新西兰教育部_战略和政策_ ...

你写的内容xpath是：

.//a/@href[contains(.,'.pdf')

复制代码

最后少了方括号，应该是

.//a/@href[contains(.,'.pdf')]

复制代码

thursdayrain · 发表于 2022-3-14 14:51:18

本帖最后由 thursdayrain 于 2022-3-14 14:53 编辑

好了，谢谢，从一个网页一下子下载18个PDF文件，强！

怎样从网页上一次性下载多个pdf文件？

共 4 个关于本帖的回复最后回复于 2022-3-14 14:51

本帖子中包含更多资源

本帖子中包含更多资源

推荐板块

精彩推荐

热门话题

热门用户

	B Color Image Link Quote Code Smilies 高级模式您需要登录后才可以回帖登录 \| 立即注册回帖并转播回帖后跳转到最后一页

怎样从网页上一次性下载多个pdf文件？

共 4 个关于本帖的回复 最后回复于 2022-3-14 14:51

本帖子中包含更多资源

本帖子中包含更多资源

推荐板块

精彩推荐

热门话题

热门用户

共 4 个关于本帖的回复最后回复于 2022-3-14 14:51