用户ym新发布了一个采集规则:
新浪微博_博主主页
详细信息:
采集热门博文的评论信息,用于分析微博效果、舆论走向、用户心理行为、舆情分析等,通过定时采集可实现持续监控的效果;微博采集需要登录账号,且要定期(1/2天)更换微博账号,降低封锁风险。      可与新浪微博_博主详细信息、新浪微博_搜索列表、新浪微博_评论、新浪微博_话题结合使用,能够实现更加全面深入的分析研究。

希望大家喜欢!下载地址: http://www.gooseeker.com/res/detail_89119.html
举报 使用道具
| 回复

共 80 个关于本帖的回复 最后回复于 2018-12-23 10:53

沙发
yxhk 新手上路 发表于 2015-9-24 13:44:46 | 只看该作者
为什么直接加载的时候会出错呢~~第8~16个属性都没法定位。。。
举报 使用道具
板凳
gooseeker_info 金牌会员 发表于 2015-9-24 14:26:38 | 只看该作者
yxhk 发表于 2015-9-24 13:44
为什么直接加载的时候会出错呢~~第8~16个属性都没法定位。。。

首先,要在登录了微博以后再加载

其次,对于博主首页或者搜索列表,因为新微博不断出现,可能会出现不含有某些抓取内容的规则,在这种情况下,抓取规则不影响使用
举报 使用道具
地板
yxhk 新手上路 发表于 2015-9-24 14:48:26 | 只看该作者
gooseeker_info 发表于 2015-9-24 14:26
首先,要在登录了微博以后再加载

其次,对于博主首页或者搜索列表,因为新微博不断出现,可能会出现不含 ...

首先我是在登录了微博以后进行的规则加载,其次,这个规则在DS中是可以抓取样本页面的相应信息的,但是在MS中加载就出错。。。。输出信息提示无法抓取定位内容8-16,所以测试也没法测试,我就没法用这个规则抓取新页面的相应信息
举报 使用道具
5#
gooseeker_info 金牌会员 发表于 2015-9-24 14:57:08 | 只看该作者
yxhk 发表于 2015-9-24 14:48
首先我是在登录了微博以后进行的规则加载,其次,这个规则在DS中是可以抓取样本页面的相应信息的,但是在 ...

找一个新的样本页面,第一条微博里面含有转发的那种。某个博主的主页微博消息会不断增加新的,会影响加载,为了稳定地能加载分析,可以用自己的微博,第一条消息可以是一条含有的成份最全的,等MS谋数台把规则加载上以后,把样本页面替换上,用菜单项 分析页面,就会替换上新的样本页面
举报 使用道具
6#
yxhk 新手上路 发表于 2015-9-24 15:06:34 | 只看该作者
这个道理我懂,我都懂。。。。我都要哭了,醉不行。。。不是这有问题就是那有问题。。。。我换了我自己的微博,结果又出问题了。又无法定位0-3.。但是我看上头也有定位信息啊,不知道怎么回事,
举报 使用道具
7#
shenzhenwan6 中级会员 发表于 2015-9-29 23:30:42 | 只看该作者
你可以在DS里直接添加线索后执行采集
举报 使用道具
8#
wxboom 新手上路 发表于 2015-10-8 10:00:18 | 只看该作者
什么情况还不知道
举报 使用道具
9#
Fuller 管理员 发表于 2015-10-8 10:47:01 | 只看该作者
wxboom 发表于 2015-10-8 10:00
什么情况还不知道

遇到了什么情况?
举报 使用道具
10#
1942634130 新手上路 发表于 2015-11-15 09:25:19 | 只看该作者
有些东西根本 怕不出来
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 利用AI阅读和分析文本:扣子COZE记录用户反
  • 在网页片段内直观标注——以B站评论采集为
  • 利用AI阅读和分析文本:使用COZE建设游记文
  • 使用AI工具Kimi生成python代码为文本分析结
  • 苹果mac电脑安装集搜客网络爬虫软件失败的

热门用户

GMT+8, 2024-11-22 02:24