快捷导航
一级任务:绿化求购第一级
二级任务:绿化求购第二级
举报 使用道具
| 回复

共 20 个关于本帖的回复 最后回复于 2021-11-19 13:11

gz51837844 管理员 发表于 2021-10-24 12:42:54 | 显示全部楼层
第二级任务:绿化求购第二级
既没有定义翻页,也没有定义连续动作, 你说的”采到三页不动了“是指什么?
举报 使用道具
tangtang1234 中级会员 发表于 2021-10-24 15:40:44 | 显示全部楼层
gz51837844 发表于 2021-10-24 12:42
第二级任务:绿化求购第二级
既没有定义翻页,也没有定义连续动作, 你说的”采到三页不动了“是指什么?
...

第一级任务里一页10条,采三页,30条就不再往下采了,下页标志是"加载更多'
举报 使用道具
gz51837844 管理员 发表于 2021-10-24 15:59:03 | 显示全部楼层
tangtang1234 发表于 2021-10-24 15:40
第一级任务里一页10条,采三页,30条就不再往下采了,下页标志是"加载更多'
...

你看看是不是勾选了”重复内容中断“:
QQ截图20211024155754.png

可以选择”否“再试试
举报 使用道具
tangtang1234 中级会员 发表于 2021-10-24 16:15:13 | 显示全部楼层
gz51837844 发表于 2021-10-24 15:59
你看看是不是勾选了”重复内容中断“:

没有 image.png
举报 使用道具
gz51837844 管理员 发表于 2021-10-24 16:39:52 | 显示全部楼层
我测试你的规则,没有碰到你说的问题
你可以看看是否限制了翻页数,是否网络有什么问题。 也可以把延迟抓取设置长一些,比如”20“, 重启后再测试下
举报 使用道具
tangtang1234 中级会员 发表于 2021-10-26 10:05:24 | 显示全部楼层
无论怎么样,绿化求购第一级采完之后,绿化求购第二级里边还是只有30条
举报 使用道具
内容分析应用 金牌会员 发表于 2021-10-26 10:32:35 | 显示全部楼层
tangtang1234 发表于 2021-10-26 10:05
无论怎么样,绿化求购第一级采完之后,绿化求购第二级里边还是只有30条

这个页面结构是嵌套的2层样例复制,你只做了外层的样例复制,所以只采集到了30条。
QQ截图20211026102817.png

建议你做如下修改: 去掉样例复制, 这样自动生成的规则会使用定位标志做定位:
QQ截图20211026103209.png
举报 使用道具
wangyong 版主 发表于 2021-10-26 10:37:53 | 显示全部楼层
tangtang1234 发表于 2021-10-26 10:05
无论怎么样,绿化求购第一级采完之后,绿化求购第二级里边还是只有30条

QQ截图20211026103036.png
这个网页,需要选择图中的div节点做定位标志映射到整理箱顶节点才能采集到完整数据
举报 使用道具
tangtang1234 中级会员 发表于 2021-10-27 13:06:39 | 显示全部楼层
内容分析应用 发表于 2021-10-26 10:32
这个页面结构是嵌套的2层样例复制,你只做了外层的样例复制,所以只采集到了30条。

取消样例映射了,现在二级任务里边成300了,一级采完也是300
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 在Jupyter Notebook中将分词结果转换成数组
  • 在Jupyter Notebook中使用word2vec和k-mean
  • 网络评价对水产品线上销量影响的实证分析—
  • “中坚青年”压力与动力转化的—以高校青年
  • “抖音”短视频文本里的新生代婆媳关系

热门用户

GMT+8, 2021-12-8 06:09