提示: 作者被禁止或删除 内容自动屏蔽
举报 使用道具
| 回复

共 4 个关于本帖的回复 最后回复于 2018-6-7 13:33

沙发
数据集 高级会员 发表于 2018-6-6 22:49:34 | 只看该作者
你的规则是选择第二个商品做的内容映射,样例复制节点也是选择的第二个商品和第三个商品,切换到第二页之后规则就报错了,报错的提示是定位不到第二个样例。

所以选择第一个商品做内容映射和样例复制,另外,不要把所有的抓取内容都勾上关键内容,这样遇到没有关键内容的页面就会报错,选择一个最常见的抓取内容勾选为关键内容就可以了,比如标题或者价格。
举报 使用道具
板凳
yxjun1984 禁止发言 发表于 2018-6-7 09:39:05 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
举报 使用道具
地板
数据集 高级会员 发表于 2018-6-7 10:08:47 | 只看该作者
本帖最后由 数据集 于 2018-6-7 10:10 编辑
yxjun1984 发表于 2018-6-7 09:39
你好,感谢您半夜还给我回复,我不做第一个样例复制,是因为第一条信息是做广告内容,随时会变动,如果网络 ...

可以选择的第二个商品和第三个商品做样例复制,这样每个页面的第一个就采集不到了,你的规则我运行测试了,翻页没有问题。采集的时候把滚屏打开,1688这个网站有反爬虫机制,操作频繁就会被封锁。
举报 使用道具
5#
yxjun1984 禁止发言 发表于 2018-6-7 13:33:34 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-25 09:51