301#
BigredLi 新手上路 发表于 2016-12-15 10:17:49 | 只看该作者
Fuller 发表于 2016-12-5 12:38
添加任务的时候,要分别选择 评论 和 转发,是两个不同的任务,同一个网址要分别添加
...

评论显示已采集,但是无法打包,现在微博评论改了,还能爬吗?
举报 使用道具
302#
Fuller 管理员 发表于 2016-12-15 10:24:29 | 只看该作者
BigredLi 发表于 2016-12-15 10:17
评论显示已采集,但是无法打包,现在微博评论改了,还能爬吗?

抓取规则也已经修改过了,能够爬。打包按钮是灰色?我们查一下
举报 使用道具
303#
BigredLi 新手上路 发表于 2016-12-15 10:40:23 | 只看该作者
Fuller 发表于 2016-12-15 10:24
抓取规则也已经修改过了,能够爬。打包按钮是灰色?我们查一下

是的呢,试了几次都是灰色的
举报 使用道具
304#
Fuller 管理员 发表于 2016-12-15 10:57:31 | 只看该作者
BigredLi 发表于 2016-12-15 10:40
是的呢,试了几次都是灰色的

可以下载了,你试下打包下载
举报 使用道具
305#
1700000072 初级会员 发表于 2016-12-15 15:03:22 | 只看该作者
为什么采集不成功啊
举报 使用道具
306#
yusir0710 新手上路 发表于 2016-12-17 16:38:54 | 只看该作者
<fullpath>字段是转发前的链接,就是输入的被转发链接。应该是转发后的链接才有意义。
举报 使用道具
307#
Fuller 管理员 发表于 2016-12-17 17:26:11 | 只看该作者
1700000072 发表于 2016-12-15 15:03
为什么采集不成功啊

具体失败的现象是什么?
举报 使用道具
308#
Fuller 管理员 发表于 2016-12-17 17:29:48 | 只看该作者
yusir0710 发表于 2016-12-17 16:38
<fullpath>字段是转发前的链接,就是输入的被转发链接。应该是转发后的链接才有意义。 ...

你是要采集微博转发?  这里我说的“转发”不是微博转发,前面我用词不准,fullpath存储的是网址重定向前的网址,realpath是重定向后的网址。你可以用百度搜索做实验。百度搜索列表中显示的每个搜索结果的网址都是baidu域名的,点击它的时候,会发生跳转,跳转到真实网址。这就发生了一次网址重定向。GooSeeker爬虫会把定向前和定向后的网址都记录下来
举报 使用道具
309#
249305365 新手上路 发表于 2016-12-18 14:08:29 | 只看该作者
想问一下,是不是一定要付费才能下载打包的数据呀,跑完了没法下载……
举报 使用道具
310#
Fuller 管理员 发表于 2016-12-18 14:10:09 | 只看该作者
249305365 发表于 2016-12-18 14:08
想问一下,是不是一定要付费才能下载打包的数据呀,跑完了没法下载……

会根据数据量扣积分。没法下载的现象是什么?
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 利用AI阅读和分析文本:扣子COZE记录用户反
  • 在网页片段内直观标注——以B站评论采集为
  • 利用AI阅读和分析文本:使用COZE建设游记文
  • 使用AI工具Kimi生成python代码为文本分析结
  • 苹果mac电脑安装集搜客网络爬虫软件失败的

热门用户

GMT+8, 2024-10-19 02:17