招聘网站数据采集翻页问题

SunnyQQ

问题描述：要采集前程无忧网站近一个月“审计管培生”招聘情况（https://search.51job.com/list/000000,000000,0000,00,9,99,%25E5%25AE%25A1%25E8%25AE%25A1%25E7%25AE%25A1%25E5%259F%25B9%25E7%2594%259F,2,1.html?lang=c&postchannel=0000&workyear=99&cotype=99°reefrom=99&jobterm=99&companysize=99&ord_field=0&dibiaoid=0&line=&welfare=）。执行任务后，采集出来的数据仅为上述网址第1、2页的内容（原网址内容共8页），且采集数据时不会停止，一直在采集重复内容。
任务名称为：审计管培生第一级003 表名为：审计管培生003
还有其它疑问：请问，层级采集后，第一二级的数据是分开不同文件夹存储的吗？有没有办法让它们在采集成功后就整合在一个文件内？
求大神解答，不胜感激！

内容分析应用 · 发表于 2021-2-23 16:11:33

管理员测试了你的规则，做了如下2点调整后，翻页是成功的：
1. 翻页偏好改成“偏好Class"
2. 用@class='next'的节点来映射翻页区

招聘网站数据采集翻页问题

共 1 个关于本帖的回复最后回复于 2021-2-23 16:11

本帖子中包含更多资源

浏览过的版块

推荐板块

精彩推荐

热门话题

热门用户

	B Color Image Link Quote Code Smilies 高级模式您需要登录后才可以回帖登录 \| 立即注册回帖并转播回帖后跳转到最后一页

招聘网站数据采集翻页问题

共 1 个关于本帖的回复 最后回复于 2021-2-23 16:11

本帖子中包含更多资源

浏览过的版块

推荐板块

精彩推荐

热门话题

热门用户

共 1 个关于本帖的回复最后回复于 2021-2-23 16:11