21#
lily_lee 初级会员 发表于 2021-10-29 16:59:11 | 只看该作者

设置翻页后,还是只能采集第一页的信息
举报 使用道具
22#
lily_lee 初级会员 发表于 2021-10-29 17:05:04 | 只看该作者

显示采集完成,去任务管理中还是显示的待采集

屏幕快照 2021-10-29 下午5.03.31.png (16.71 KB, 下载次数: 274)

屏幕快照 2021-10-29 下午5.03.31.png
举报 使用道具
23#
内容分析应用 金牌会员 发表于 2021-10-29 17:08:55 | 只看该作者
启动采集的时候, 你需要采集多少条网址, 就把数字填上去,详细步骤参看:启动数据采集
举报 使用道具
24#
lily_lee 初级会员 发表于 2021-10-29 17:14:03 | 只看该作者
内容分析应用 发表于 2021-10-29 17:08
启动采集的时候, 你需要采集多少条网址, 就把数字填上去,详细步骤参看:启动数据采集 ...

怎么解决无法翻页的情况呢,这个比较着急解决,永远都只能自动采集第一页,第2页开始手动添加吗?
举报 使用道具
25#
内容分析应用 金牌会员 发表于 2021-10-29 17:20:26 | 只看该作者
lily_lee 发表于 2021-10-29 17:14
怎么解决无法翻页的情况呢,这个比较着急解决,永远都只能自动采集第一页,第2页开始手动添加吗?
...

哪个任务名翻页不行?
运行的时候, 你可以观察下爬取窗口, 页面有没有正常加载
举报 使用道具
26#
lily_lee 初级会员 发表于 2021-10-29 17:31:23 | 只看该作者
内容分析应用 发表于 2021-10-29 17:20
哪个任务名翻页不行?
运行的时候, 你可以观察下爬取窗口, 页面有没有正常加载
...

任务名戴厚良一级抓取的翻页不行,任务名戴厚良二级抓取,在抓取时总是失败
举报 使用道具
27#
wangyong 版主 发表于 2021-10-29 17:33:17 | 只看该作者
lily_lee 发表于 2021-10-29 17:14
怎么解决无法翻页的情况呢,这个比较着急解决,永远都只能自动采集第一页,第2页开始手动添加吗?
...

着急使用的话,可以用集搜客快捷采集,把要采集的网址,输入进去就可以采集,不用自己做采集规则https://www.gooseeker.com/res/rule_667.html

举报 使用道具
28#
lily_lee 初级会员 发表于 2021-10-29 17:35:22 | 只看该作者
wangyong 发表于 2021-10-29 17:33
着急使用的话,可以用集搜客快捷采集,把要采集的网址,输入进去就可以采集,不用自己做采集规则https:// ...

比较纠结问题所在,因为是完全按照教程来做的,不知道哪里有问题就很焦虑
举报 使用道具
29#
内容分析应用 金牌会员 发表于 2021-10-29 17:43:31 | 只看该作者
lily_lee 发表于 2021-10-29 17:31
任务名戴厚良一级抓取的翻页不行,任务名戴厚良二级抓取,在抓取时总是失败
...

戴厚良一级抓取”规则我测试翻页没有问题, 可以修改的点是: 选一个字段设为“关键内容”:key
启动采集时,我设置了限制翻5页,正常生成了5个xml结果文件


你看看你的爬虫软件是什么版本
举报 使用道具
30#
lily_lee 初级会员 发表于 2021-10-29 17:52:06 | 只看该作者
内容分析应用 发表于 2021-10-29 17:43
“戴厚良一级抓取”规则我测试翻页没有问题, 可以修改的点是: 选一个字段设为“关键内容”:key
启动采 ...

太奇怪了,我的版本是数据管家11.0.1,我没法翻页,然后另一个任务几乎全部采集失败
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-23 14:25