11#
beanbing 中级会员 发表于 2017-4-22 09:21:46 | 只看该作者
scraper 发表于 2017-4-21 15:05
你真的改过规则了吗

没有保存到= =超时都设置了200秒了   还是只爬三页左右就没有了,这个是反爬虫吗
举报 使用道具
12#
Fuller 管理员 发表于 2017-4-22 10:21:48 | 只看该作者
beanbing 发表于 2017-4-22 09:21
没有保存到= =超时都设置了200秒了   还是只爬三页左右就没有了,这个是反爬虫吗
...



不是反爬,我用你的规则,翻页到第五页了,匹配失败,说明整理箱上做的内容映射不合适,我看了一下你定义的抓取内容,都勾上了“关键内容”,没有必要,因为到后面页,很多内容就没有了,关键内容确保不了,所以出现匹配失败。
举报 使用道具
13#
beanbing 中级会员 发表于 2017-4-22 10:35:59 | 只看该作者
Fuller 发表于 2017-4-22 10:21
不是反爬,我用你的规则,翻页到第五页了,匹配失败,说明整理箱上做的内容映射不合适,我看了一下你定 ...

那是不要勾上??比如VP有些是没有的,有些有的,对于这些就不要勾吗
举报 使用道具
14#
Fuller 管理员 发表于 2017-4-22 11:11:49 | 只看该作者
beanbing 发表于 2017-4-22 10:35
那是不要勾上??比如VP有些是没有的,有些有的,对于这些就不要勾吗

是的,不要勾
举报 使用道具
15#
beanbing 中级会员 发表于 2017-6-20 10:14:32 | 只看该作者

那这个翻页要怎么做呢?弄了记号线索  失败 不行
弄了连续动作也不对,观察一下url  是每一个页面对应一个数字 number1,number2.。。。。。
举报 使用道具
16#
wangyong 版主 发表于 2017-6-20 11:07:23 | 只看该作者
记号线索无法翻页的话可以用相对线索
还可以参看翻页到中间就失败了怎样解决

举报 使用道具
17#
beanbing 中级会员 发表于 2017-6-20 14:09:30 | 只看该作者
主题名为: 评论一款产品 ,这个是同样的  但是不行   相对线索都试过了  也没有提示什么失败
举报 使用道具
18#
beanbing 中级会员 发表于 2017-6-20 14:09:46 | 只看该作者
wangyong 发表于 2017-6-20 11:07
记号线索无法翻页的话可以用相对线索
还可以参看翻页到中间就失败了怎样解决

主题名为: 评论一款产品 ,这个是同样的  但是不行   相对线索都试过了  也没有提示什么失败

举报 使用道具
19#
wangyong 版主 发表于 2017-6-20 14:41:12 | 只看该作者
翻页线索要勾连贯抓取
整理箱中的抓取内容必须有一个勾关键内容
举报 使用道具
20#
Kernel_Debug 初级会员 发表于 2018-3-22 09:49:59 | 只看该作者
现在亚马逊评论采集,有更简单方便的方法,用Gooseeker数据DIY采集亚马逊,直接输入商品网址就可以采集了
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 苹果mac电脑安装集搜客网络爬虫软件失败的
  • 下载支持win7的集搜客网络爬虫软件
  • 遇到“无法识别的应用”告警怎么办?
  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词

热门用户

GMT+8, 2024-6-26 22:45