每条线索抓两次,大神能帮看下是不是规则设置出了问题?
QQ图片20190428171646.png
举报 使用道具
| 回复

共 4 个关于本帖的回复 最后回复于 2019-4-29 09:44

Fuller 管理员 发表于 2019-4-28 18:30:31 | 显示全部楼层
翻页20190428182849.png
因为你这里定义了一个翻页,翻页这种操作,线索号是不变的,但是每翻一页,会生成一个结果文件,而图片也会下载一次。

你这个翻页的目的是什么?
举报 使用道具
cwf0920 新手上路 发表于 2019-4-29 09:41:00 | 显示全部楼层
Fuller 发表于 2019-4-28 18:30
因为你这里定义了一个翻页,翻页这种操作,线索号是不变的,但是每翻一页,会生成一个结果文件,而图片也 ...

页面上有个显示文章数量的地方,要点击一下才会全部显示出来(是个动态请求,不是隐藏起来了),那个设置我是想设置个点击,显示出全部文章数后才执行设置的规则。
举报 使用道具
cwf0920 新手上路 发表于 2019-4-29 09:43:52 | 显示全部楼层
Fuller 发表于 2019-4-28 18:30
因为你这里定义了一个翻页,翻页这种操作,线索号是不变的,但是每翻一页,会生成一个结果文件,而图片也 ...

你现在看的规则,是我修改后的,之前我是在连续动作里设置了个单击
举报 使用道具
Fuller 管理员 发表于 2019-4-29 09:44:25 | 显示全部楼层
cwf0920 发表于 2019-4-29 09:41
页面上有个显示文章数量的地方,要点击一下才会全部显示出来(是个动态请求,不是隐藏起来了),那个设置 ...

可以这样做,这样的话,点击这个之前采集了一遍图片,点击这个以后,又采集了一遍,所以图片有两遍采集是正常的。

这里的记号线索最好优化一下,See All 51前面有好几个空格,如果空格数量不确定,规则很容易失效,所以,应该
1,“全匹配”不好勾选
2,在记号值编辑框中,删除前面这些空格
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-3-29 18:54