前几天用GooSeeker,还挺爽的,但是这几天滑块无限,根本不知道怎么破解
更换了UA,每天换一个淘宝号和IP,现在速度也不快,抓取时间间隔是5S
但是现在还是滑块好厉害
请问有什么方式解决吗
举报 使用道具
| 回复

共 4 个关于本帖的回复 最后回复于 2021-4-29 14:09

沙发
Fuller 管理员 发表于 2021-2-6 19:16:48 | 只看该作者
换IP以后一定要清除缓存和cookie,因为在cookie中记录了一些访问统计信息,如果光换IP,网页还是能利用以往的统计信息判断出来你已经访问得很频繁了。

但是,现在淘宝限制太厉害,即使这些手段都用上也很难大量采集。

清除缓存和cookie的方法:https://www.gooseeker.com/doc/thread-18152-1-1.html
举报 使用道具
板凳
a358223957 新手上路 发表于 2021-2-7 11:32:51 | 只看该作者
Fuller 发表于 2021-2-6 19:16
换IP以后一定要清除缓存和cookie,因为在cookie中记录了一些访问统计信息,如果光换IP,网页还是能利用以往 ...

我也会每天清理cookie,请问现在还有什么更好点的方式方法吗
举报 使用道具
地板
a358223957 新手上路 发表于 2021-2-7 11:33:30 | 只看该作者
很惆怅的,或者是有什么方式可以大量采集吗
举报 使用道具
5#
Fuller 管理员 发表于 2021-2-7 11:40:02 | 只看该作者
a358223957 发表于 2021-2-7 11:33
很惆怅的,或者是有什么方式可以大量采集吗

现在这个问题很突出,如果目标网站有意设定限制爬虫的检测,爬虫是没办法突破的,现在的检测手段很高明
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 话题分析(NMF模型和LDA模型)软件的安装和
  • 运行Apple无法验证的程序的方法
  • 文本聚类分析软件的安装和使用方法
  • 利用AI阅读和分析文本:扣子COZE记录用户反
  • 在网页片段内直观标注——以B站评论采集为

热门用户

GMT+8, 2025-2-6 15:00