5 7093

翻页采集遇到的问题

hajnxg 于 2017-2-28 15:29 发表 [复制链接]
翻页爬数据的时候,翻到第二页,就不动了,然后过了一会提示采集完成,但实际上只采集到了第一页,求解
使用规则主题:
1.方便食品有货
2.休闲无货
两个都存在同样问题


举报 使用道具
| 回复

共 5 个关于本帖的回复 最后回复于 2017-2-28 15:48

scraper 论坛元老 发表于 2017-2-28 15:36:07 | 显示全部楼层
你把全部抓取内容都勾了关键内容 不需要 只勾商品名称就可以了
因为价格有促销二字跟没有促销二字是不一样的
所以导致第二页不适应规则
实际上第一页都没有采全 你可以看看
你改一下规则 去掉多余的关键内容 修改价格的映射
举报 使用道具
scraper 论坛元老 发表于 2017-2-28 15:41:13 | 显示全部楼层
你为什么要做两个规则?
举报 使用道具
hajnxg 新手上路 发表于 2017-2-28 15:41:34 | 显示全部楼层
好的,多谢了
举报 使用道具
hajnxg 新手上路 发表于 2017-2-28 15:42:34 | 显示全部楼层
scraper 发表于 2017-2-28 15:41
你为什么要做两个规则?

一个采集有货,一个采集无货的,要不总有漏的
举报 使用道具
scraper 论坛元老 发表于 2017-2-28 15:48:39 | 显示全部楼层
hajnxg 发表于 2017-2-28 15:42
一个采集有货,一个采集无货的,要不总有漏的

QQ截图20170228154808.png
漏采是因为规则没做好 加上定位标志映射

举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-3-29 01:21