1 6533

网页采集不全

陈恒 于 2017-9-13 14:22 发表 [复制链接]
我设置了翻页抓取,每一页又设置了样例复制,每一页有12个样例要抓取,但是每一页都是只抓取了前四个,请问怎么解决?
我的是层级规则:第一规则:杀毒软件  第二级规则:杀毒软件2


举报 使用道具
| 回复

共 1 个关于本帖的回复 最后回复于 2017-9-13 14:39

bowieD 金牌会员 发表于 2017-9-13 14:39:40 | 显示全部楼层
规则可以正常运行,但是不严谨。
1,没有勾选关键内容,可能导致漏采,即使抓取规则有错误,也不报错,每一页只抓了前四个和可能就是因为没有勾选关键内容。
2,没有做定位映射,可能导致定位不准确
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-3-28 17:05