11#
数据集二期 中级会员 发表于 2018-1-5 09:49:11 | 只看该作者
lzy163mail 发表于 2018-1-5 09:41
你好,是还要在建立主题名 为PDF——download999 的主题吗?

主题名可以随便建立,只要可用就行。下载附件可参考《用集搜客实现自动下载批量文件》
举报 使用道具
12#
lzy163mail 新手上路 发表于 2018-1-5 10:09:23 | 只看该作者
数据集二期 发表于 2018-1-5 09:49
主题名可以随便建立,只要可用就行。下载附件可参考《用集搜客实现自动下载批量文件》 ...

里面内容呢,要求整理箱必须不能空?
举报 使用道具
13#
lzy163mail 新手上路 发表于 2018-1-5 10:12:20 | 只看该作者
lzy163mail 发表于 2018-1-5 10:09
里面内容呢,要求整理箱必须不能空?

急急急,谢谢
举报 使用道具
14#
wangyong 版主 发表于 2018-1-5 10:31:58 | 只看该作者

抓网页上的任何一个内容都行,不用勾关键内容
举报 使用道具
15#
lzy163mail 新手上路 发表于 2018-1-5 10:35:13 | 只看该作者
wangyong 发表于 2018-1-5 10:31
抓网页上的任何一个内容都行,不用勾关键内容

可是把PDF的网页输进去就是下载呀
举报 使用道具
16#
数据集二期 中级会员 发表于 2018-1-5 10:37:05 | 只看该作者
lzy163mail 发表于 2018-1-5 10:35
可是把PDF的网页输进去就是下载呀

输入有下载PDF按钮的网页链接,再制作规则。
举报 使用道具
17#
lzy163mail 新手上路 发表于 2018-1-5 11:34:10 | 只看该作者
数据集二期 发表于 2018-1-5 10:37
输入有下载PDF按钮的网页链接,再制作规则。

怎样检测doc 呢?
举报 使用道具
18#
wangyong 版主 发表于 2018-1-5 11:40:14 | 只看该作者

不论是PDF还是DOC只要是输入的链接可以直接下载就行
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-2 07:18