351#
lz2666 新手上路 发表于 2017-3-1 12:37:36 | 只看该作者
xandy 发表于 2017-3-1 11:25
在采集之前你在浏览器上登录了你的微博账号吗?没有的话要先登录。用火狐插件版爬虫就在火狐登录,用GS爬 ...

我的微博账号在GS爬虫浏览器上登录过了
举报 使用道具
352#
xandy 论坛元老 发表于 2017-3-1 14:16:42 | 只看该作者
lz2666 发表于 2017-3-1 12:37
我的微博账号在GS爬虫浏览器上登录过了

如果是采集自己博主资料,登录的微博账号不能是自己的账号(就是说抓的账号和你登的账号不能使一样的,因为页面结构不一样)。如果并没有出现刚刚说的情况,你删掉任务,重新添加一次,重抓一遍,我们测试是正常的。
举报 使用道具
353#
lz2666 新手上路 发表于 2017-3-1 14:24:37 | 只看该作者
xandy 发表于 2017-3-1 14:16
如果是采集自己博主资料,登录的微博账号不能是自己的账号(就是说抓的账号和你登的账号不能使一样的,因 ...

我是抓的别人的主页啊,不是我自己的,也重新添加任务几次了,实在不行我换台电脑试试吧
举报 使用道具
354#
xandy 论坛元老 发表于 2017-3-1 14:27:51 | 只看该作者
lz2666 发表于 2017-3-1 14:24
我是抓的别人的主页啊,不是我自己的,也重新添加任务几次了,实在不行我换台电脑试试吧
...

是的,你重新试下,把全面的任务删除重新添加一次,我们上午测试你的任务都能够顺利打包下载数据的。
举报 使用道具
355#
SeekYuki 新手上路 发表于 2017-3-2 19:21:23 | 只看该作者
您好,我要采的数据>31页,我自己登微博页面发现只能搜到50页数据,我想把这50页含有关键词的微博都扒下来,但我在设置“发布时间”的时候,发现那个溯回的日期,稍微久远一点,比如今天是3月我设的1月1日至1月31日,然后新浪就报错,表示【抱歉,未找到“关键字”相关结果。】,不管在采集界面,还是我拿新浪的搜索手动搜,都是这样的。这个要怎么解决呀
举报 使用道具
356#
SeekYuki 新手上路 发表于 2017-3-2 19:22:04 | 只看该作者
可不可以出一个新规则,用户可以自定义页数,而不是时间啊?
举报 使用道具
357#
shenzhenwan10 金牌会员 发表于 2017-3-2 19:32:39 | 只看该作者
如果搜索结果多, 微博不会全显示的, 你需要把时间段拆分成更细的
举报 使用道具
358#
SeekYuki 新手上路 发表于 2017-3-2 19:41:49 | 只看该作者
万分感谢 @shenzhenwan10 这么晚还在解决问题 搞定啦 但我还是希望大神们能写一条可以翻页的规则出来[捂脸]
举报 使用道具
359#
Fuller 管理员 发表于 2017-3-2 20:50:35 | 只看该作者
SeekYuki 发表于 2017-3-2 19:41
万分感谢 @shenzhenwan10 这么晚还在解决问题 搞定啦 但我还是希望大神们能写一条可以翻页的规则出来[捂脸] ...

因为微博对翻页有限制,所以,要划分成时间段,一段时间内不要超过40页,否则会出验证码
举报 使用道具
360#
kkingwing 高级会员 发表于 2017-3-3 10:15:53 | 只看该作者
请问用自己新建的规则,线索导入大约200+,但是在运行到50多个线索的时候就会被提示访问频繁,请问需要怎么解决
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 运行Apple无法验证的程序的方法
  • 文本聚类分析软件的安装和使用方法
  • 利用AI阅读和分析文本:扣子COZE记录用户反
  • 在网页片段内直观标注——以B站评论采集为
  • 利用AI阅读和分析文本:使用COZE建设游记文

热门用户

GMT+8, 2024-12-19 22:02