新浪微博_博主主页

3615 135 78 所需积分:2000 更新时间:2015-08-13 11:30 类别: 社交网络

规则介绍

本规则采集博主主页的博文信息,可以批量采集微博网址的数据,只需把同类网址导入到规则即可,具体使用方法请参考教程 http://www.gooseeker.com/doc/article-85-1.html 。 【注意:采集前要设置DS打数机的配置菜单->滚屏参数,滚屏次数为15或以上,滚屏速度为2,具体参数含义请看滚屏设置 http://www.gooseeker.com/doc/article-57-21.html 】。 【微博采集需要登录账号,且要定期(1或2天)更换微博账号,降低封锁风险】。 可与新浪微博_博主详细信息、新浪微博_搜索列表、新浪微博_评论、新浪微博_话题等规则资源结合使用,能够实现更加全面深入的分析研究。
       若你想免除做规则的时间,可使用微博博主主页采集工具直接获取数据。

注:请先登录所抓取的网站,再运行该规则。 (如果该规则与描述不符或无效,您可 申诉。)

采集内容

信息字段 网页内容
博主主页
博主
简介
关注数
粉丝数
微博数
博文列表
all
博文
发布时间
博文独立网址
发布终端
转发数
评论数
点赞数
转发_博主名称
转发_博主主页
转发_博文
转发_发布时间
转发_博文独立网址
转发_发布终端
转发_转发数
转发_评论数
转发_点赞数

数据截图

用户评论

  1. yxhk 2015-09-24 13:44

    为什么直接加载的时候会出错呢~~第8~16个属性都没法定位。。。

  2. gooseeker_info 2015-09-24 14:26

    首先,要在登录了微博以后再加载 其次,对于博主首页或者搜索列表,因为新微博不断出现,可能会出现不含有某些抓取内容的规则,在这种情况下,抓取规则不影响使用

  3. yxhk 2015-09-24 14:48

    首先我是在登录了微博以后进行的规则加载,其次,这个规则在DS中是可以抓取样本页面的相应信息的,但是在MS中加载就出错。。。。输出信息提示无法抓取定位内容8-16,所以测试也没法测试,我就没法用这个规则抓取新页面的相应信息

  4. gooseeker_info 2015-09-24 14:57

    找一个新的样本页面,第一条微博里面含有转发的那种。某个博主的主页微博消息会不断增加新的,会影响加载,为了稳定地能加载分析,可以用自己的微博,第一条消息可以是一条含有的成份最全的,等MS谋数台把规则加载上以后,把样本页面替换上,用菜单项 分析页面,就会替换上新的样本页面

  5. yxhk 2015-09-24 15:06

    这个道理我懂,我都懂。。。。我都要哭了,醉不行。。。不是这有问题就是那有问题。。。。我换了我自己的微博,结果又出问题了。又无法定位0-3.。但是我看上头也有定位信息啊,不知道怎么回事,

关于作者

作者其他资源更多 >

学校列表-findingschool网站
findingschool网站的院校点评列表,教育行业信息,国外学校最新资讯,留学必备参考。可以与规则“学校详情-findingschool网站”一起使用,这样就可以把采到的网址生成第二级“学校详情-findingschool网站”的线索,用第二级规则就可以抓取到更多详细信息。
学校详情-findingschool网站
findingschool网站的国外各大院校的详情信息,教育行业信息,国外学校最新资讯,留学参考必备,可以深入分析了解国外学校收费资讯、教育资质、硬件设施等
新浪微博_博主主页
本规则采集博主主页的博文信息,可以批量采集微博网址的数据,只需把同类网址导入到规则即可,具体使用方法请参考教程 http://www.gooseeker.com/doc/article-85-1.html 。 【注意:采集前要设置DS打数机的配置菜单->滚屏参数,滚屏次数为15或以上,滚屏速度为2,具体参数含义请看滚屏设置 http://www.gooseeker.com/doc/article-57-21.html 】。 【微博采集需要登录账号,且要定期(1或2天)更换微博账号,降低封锁风险】。 可与新浪微博_博主详细信息、新浪微博_搜索列表、新浪微博_评论、新浪微博_话题等规则资源结合使用,能够实现更加全面深入的分析研究。
       若你想免除做规则的时间,可使用微博博主主页采集工具直接获取数据。

V8.9 版权所有 © 2007-2016 GooSeeker 深圳市天据电子商务有限公司
粤ICP备11065265号-2 粤公网安备 44030502000239号