集搜客GooSeeker网络爬虫

标题: 集搜客爬虫软件和数据管家怎样清除cookie/缓存/网页访问记录 [打印本页]

作者: wangyong    时间: 2020-10-16 10:11
标题: 集搜客爬虫软件和数据管家怎样清除cookie/缓存/网页访问记录
本帖最后由 wangyong 于 2020-10-16 10:33 编辑

集搜客爬虫软件和数据管家怎样清理cookie/缓存/网页访问记录

作者: wangyong    时间: 2020-10-16 10:27
一、新版爬虫软件(数据管家)清除cookie的方法
[attach]13142[/attach]
#1,点击设置按钮
#2,选择隐私和历史
#3,勾选清除所有
#4,点击清除

二、旧版本爬虫软件清除cookie的方法
[attach]13143[/attach]#1,点击设置按钮
#2,选择清除历史
#3,勾选清除所有
#4,点击清除
#5,保存关闭
清理cookie的方法Mac版软件和Windows版软件相同




作者: 内容分析应用    时间: 2020-10-16 10:38
是不是按上面的步骤在软件界面上清理就可以了? 以前有帖子说需要去清理appdata下的特定文件夹和数据



作者: wangyong    时间: 2020-10-16 11:02
内容分析应用 发表于 2020-10-16 10:38
是不是按上面的步骤在软件界面上清理就可以了? 以前有帖子说需要去清理appdata下的特定文件夹和数据

是的,现在在软件界面上清理就是代替了以前在文件夹清理的方法

作者: Fuller    时间: 2020-10-16 11:18
如果采集需要登录的网站,一定要记得在清除cookie以后重新登录目标网址。

比如,用集搜客微博采集工具箱采集关键词搜索结果、博主主页和信息、评论和转发等等所有版块,采集微博一定要登录

还有用集搜客快捷采集工具采集电商类网站,目前很多电商网站需要登录以后才能采集更多内容,比如,登录天猫。

作者: Fuller    时间: 2020-10-16 11:19
Fuller 发表于 2020-10-16 11:18
如果采集需要登录的网站,一定要记得在清除cookie以后重新登录目标网址。

比如,用集搜客微博采集工具箱采 ...

如果是用集搜客网络爬虫软件采集这些网站,那么就要在网络爬虫的浏览器中登录目标网站;
如果是用集搜客数据管家软件采集这些网站,那么就要在数据管家的浏览器中登录目标网站

作者: xinzhe    时间: 2021-5-12 12:17
你好 现在是不能指定爬取原创微博吗?
作者: 内容分析应用    时间: 2021-5-12 14:53
xinzhe 发表于 2021-5-12 12:17
你好 现在是不能指定爬取原创微博吗?

你说得原创微博是指什么?

作者: Fuller    时间: 2025-4-1 12:41
手工清除的方法参看帖子:https://www.gooseeker.com/doc/thread-19224-1-1.html




欢迎光临 集搜客GooSeeker网络爬虫 (https://www.gooseeker.com/doc/) Powered by Discuz! X3.2