我登陆了,但是抓到200页左右就显示要登录,在浏览器刷新下,已经不是登录状态了。这个插件不是跟火狐共用的cookie吗,理论上插件访问也产生cookie的,所以内容不断更新,不应该掉线的啊
举报 使用道具
| 回复

共 4 个关于本帖的回复 最后回复于 2016-1-6 15:23

沙发
Fuller 管理员 发表于 2016-1-5 23:30:31 | 只看该作者
是共用cookie,正常的话是会刷新登录状态的。但是,如果网站监测到这是不受欢迎的爬虫行为,网站可以下发一个让cookie失效的命令。

另外还要查找另一个原因,看看Firefox的隐私设置里面是否允许了cookie
举报 使用道具
板凳
落翎 中级会员 发表于 2016-1-6 11:24:41 | 只看该作者
Fuller 发表于 2016-1-5 23:30
是共用cookie,正常的话是会刷新登录状态的。但是,如果网站监测到这是不受欢迎的爬虫行为,网站可以下发一 ...

是我这边看,还是你们那边处理
举报 使用道具
地板
ym 版主 发表于 2016-1-6 14:47:13 | 只看该作者
在本地火狐浏览器的选项菜单里设置
举报 使用道具
5#
gz51837844 管理员 发表于 2016-1-6 15:23:28 | 只看该作者
以前抓取淘宝的数据魔方也频繁碰到过无规律被踢出来的情况,感觉淘宝天猫的反扒是一大套组合拳
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-6 06:09