1041#
酵母酵母 新手上路 发表于 2020-2-29 00:41:51 | 只看该作者
你好!我在采集时候只能采到微博未登录页面的第一页,我总是登录不上去,不知道是采集的太快还是什么,连密码都没输完就采集完毕了,然后浏览器页面就再也加载不出来了,导致一直只能采集到第一页的tag信息,请太太指教!!!
举报 使用道具
1042#
Fuller 管理员 发表于 2020-2-29 08:10:23 | 只看该作者
酵母酵母 发表于 2020-2-29 00:41
你好!我在采集时候只能采到微博未登录页面的第一页,我总是登录不上去,不知道是采集的太快还是什么,连密 ...

不是在爬虫都运行起来才登录,而是预先登录。就是把集搜客爬虫软件运行起来以后,你看到的是一个浏览器的样子,这时候访问微博,手工做登录。这个都准备好了,再运行起来DS打数机爬数据
举报 使用道具
1043#
酵母酵母 新手上路 发表于 2020-2-29 14:25:02 | 只看该作者
Fuller 发表于 2020-2-29 08:10
不是在爬虫都运行起来才登录,而是预先登录。就是把集搜客爬虫软件运行起来以后,你看到的是一个浏览器的 ...

谢谢!已经解决了!
但是两万多条的转发我只抓到了一半TwT
是因为我不是氪金用户吗

举报 使用道具
1044#
spurs20 新手上路 发表于 2020-3-2 14:25:07 | 只看该作者
粉丝与关注者信息 为什么爬出来的主页链接都是一样的?
举报 使用道具
1045#
Fuller 管理员 发表于 2020-3-2 16:35:15 | 只看该作者
spurs20 发表于 2020-3-2 14:25
粉丝与关注者信息 为什么爬出来的主页链接都是一样的?

同一个微博博主的链接是一样的。

你看到了两个不同的博主爬下来的是同一个网址?
举报 使用道具
1046#
zhaozihan99 新手上路 发表于 2020-3-4 17:19:28 | 只看该作者
爬微博评论,一直显示抓取规则不合适或者超时时间设置太短 怎么办啊
举报 使用道具
1047#
Fuller 管理员 发表于 2020-3-4 18:07:47 | 只看该作者
zhaozihan99 发表于 2020-3-4 17:19
爬微博评论,一直显示抓取规则不合适或者超时时间设置太短 怎么办啊

在DS打数机运行的时候,注意观察有没有评论显示出来,现在新浪微博很慢,经常不显示。

另外,DS打数机窗口不能缩小
举报 使用道具
1048#
Fuller 管理员 发表于 2020-3-4 18:12:26 | 只看该作者
微博采集的常见问题汇总:https://www.gooseeker.com/doc/thread-17343-1-1.html
举报 使用道具
1049#
pypypy 初级会员 发表于 2020-3-6 22:05:50 | 只看该作者
求问爬取微博评论页面一直加载中,无法爬取评论怎么解决?单独用其他浏览器打开是可以看到评论的
举报 使用道具
1050#
maomao 论坛元老 发表于 2020-3-6 22:08:28 | 只看该作者
pypypy 发表于 2020-3-6 22:05
求问爬取微博评论页面一直加载中,无法爬取评论怎么解决?单独用其他浏览器打开是可以看到评论的 ...

按这个帖子一楼的回答清缓存https://www.gooseeker.com/doc/thread-11667-1-1.html
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-19 23:43