311#
Fuller 管理员 发表于 2016-12-17 17:29:48 | 只看该作者
yusir0710 发表于 2016-12-17 16:38
<fullpath>字段是转发前的链接,就是输入的被转发链接。应该是转发后的链接才有意义。 ...

你是要采集微博转发?  这里我说的“转发”不是微博转发,前面我用词不准,fullpath存储的是网址重定向前的网址,realpath是重定向后的网址。你可以用百度搜索做实验。百度搜索列表中显示的每个搜索结果的网址都是baidu域名的,点击它的时候,会发生跳转,跳转到真实网址。这就发生了一次网址重定向。GooSeeker爬虫会把定向前和定向后的网址都记录下来
举报 使用道具
312#
249305365 新手上路 发表于 2016-12-18 14:08:29 | 只看该作者
想问一下,是不是一定要付费才能下载打包的数据呀,跑完了没法下载……
举报 使用道具
313#
Fuller 管理员 发表于 2016-12-18 14:10:09 | 只看该作者
249305365 发表于 2016-12-18 14:08
想问一下,是不是一定要付费才能下载打包的数据呀,跑完了没法下载……

会根据数据量扣积分。没法下载的现象是什么?
举报 使用道具
314#
wutao2014 新手上路 发表于 2016-12-18 15:40:22 | 只看该作者
微博博主的关注只能爬前5页的
举报 使用道具
315#
Fuller 管理员 发表于 2016-12-18 15:57:14 | 只看该作者
wutao2014 发表于 2016-12-18 15:40
微博博主的关注只能爬前5页的

是的,因为微博网站做了限定,爬虫无法突破网站做的限定
举报 使用道具
316#
jsk1327440 新手上路 发表于 2017-1-10 11:19:13 | 只看该作者
采集完无法打包怎么办??有办法解决吗?
举报 使用道具
317#
xandy 论坛元老 发表于 2017-1-10 11:22:01 | 只看该作者
jsk1327440 发表于 2017-1-10 11:19
采集完无法打包怎么办??有办法解决吗?

采集完后,打包状态是绿色的就是可点击进行打包下载的,打包后在点击“数据下载”就可以将数据下载到本地。
举报 使用道具
318#
jsk1327440 新手上路 发表于 2017-1-10 11:47:29 | 只看该作者
xandy 发表于 2017-1-10 11:22
采集完后,打包状态是绿色的就是可点击进行打包下载的,打包后在点击“数据下载”就可以将数据下载到本地 ...


本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
319#
jsk1327440 新手上路 发表于 2017-1-10 13:48:23 | 只看该作者
xandy 发表于 2017-1-10 11:22
采集完后,打包状态是绿色的就是可点击进行打包下载的,打包后在点击“数据下载”就可以将数据下载到本地 ...

能不能帮我解决一下这个问题啊!爬了半天不能打包的心情是很难过的!
举报 使用道具
320#
xandy 论坛元老 发表于 2017-1-10 14:09:42 | 只看该作者
jsk1327440 发表于 2017-1-10 13:48
能不能帮我解决一下这个问题啊!爬了半天不能打包的心情是很难过的!

稍等, 技术人员给你查一下
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 利用AI阅读和分析文本:扣子COZE记录用户反
  • 在网页片段内直观标注——以B站评论采集为
  • 利用AI阅读和分析文本:使用COZE建设游记文
  • 使用AI工具Kimi生成python代码为文本分析结
  • 苹果mac电脑安装集搜客网络爬虫软件失败的

热门用户

GMT+8, 2024-9-29 06:02