一级任务:绿化求购第一级
二级任务:绿化求购第二级
举报 使用道具
| 回复

共 20 个关于本帖的回复 最后回复于 2021-11-19 13:11

沙发
gz51837844 管理员 发表于 2021-10-24 12:42:54 | 只看该作者
第二级任务:绿化求购第二级
既没有定义翻页,也没有定义连续动作, 你说的”采到三页不动了“是指什么?
举报 使用道具
板凳
tangtang1234 高级会员 发表于 2021-10-24 15:40:44 | 只看该作者
gz51837844 发表于 2021-10-24 12:42
第二级任务:绿化求购第二级
既没有定义翻页,也没有定义连续动作, 你说的”采到三页不动了“是指什么?
...

第一级任务里一页10条,采三页,30条就不再往下采了,下页标志是"加载更多'
举报 使用道具
地板
gz51837844 管理员 发表于 2021-10-24 15:59:03 | 只看该作者
tangtang1234 发表于 2021-10-24 15:40
第一级任务里一页10条,采三页,30条就不再往下采了,下页标志是"加载更多'
...

你看看是不是勾选了”重复内容中断“:


可以选择”否“再试试
举报 使用道具
5#
tangtang1234 高级会员 发表于 2021-10-24 16:15:13 | 只看该作者
gz51837844 发表于 2021-10-24 15:59
你看看是不是勾选了”重复内容中断“:

没有
举报 使用道具
6#
gz51837844 管理员 发表于 2021-10-24 16:39:52 | 只看该作者
我测试你的规则,没有碰到你说的问题
你可以看看是否限制了翻页数,是否网络有什么问题。 也可以把延迟抓取设置长一些,比如”20“, 重启后再测试下
举报 使用道具
7#
tangtang1234 高级会员 发表于 2021-10-26 10:05:24 | 只看该作者
无论怎么样,绿化求购第一级采完之后,绿化求购第二级里边还是只有30条
举报 使用道具
8#
内容分析应用 金牌会员 发表于 2021-10-26 10:32:35 | 只看该作者
tangtang1234 发表于 2021-10-26 10:05
无论怎么样,绿化求购第一级采完之后,绿化求购第二级里边还是只有30条

这个页面结构是嵌套的2层样例复制,你只做了外层的样例复制,所以只采集到了30条。


建议你做如下修改: 去掉样例复制, 这样自动生成的规则会使用定位标志做定位:

举报 使用道具
9#
wangyong 版主 发表于 2021-10-26 10:37:53 | 只看该作者
tangtang1234 发表于 2021-10-26 10:05
无论怎么样,绿化求购第一级采完之后,绿化求购第二级里边还是只有30条


这个网页,需要选择图中的div节点做定位标志映射到整理箱顶节点才能采集到完整数据
举报 使用道具
10#
tangtang1234 高级会员 发表于 2021-10-27 13:06:39 | 只看该作者
内容分析应用 发表于 2021-10-26 10:32
这个页面结构是嵌套的2层样例复制,你只做了外层的样例复制,所以只采集到了30条。

取消样例映射了,现在二级任务里边成300了,一级采完也是300
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-6-2 20:23