6 11268

微博采集

lucky半杯 于 2017-5-3 13:05 发表 [复制链接]
我采集输入一条例如#白百何#后,出来的数据的中用户名,评论,点赞,等信息有现成的吗?我做的规则为什么每个都出来2次重复的。
规则名:简单微博采集

举报 使用道具
| 回复

共 6 个关于本帖的回复 最后回复于 2017-5-3 16:27

HJLing 版主 发表于 2017-5-3 14:34:17 | 显示全部楼层
QQ截图20170503143332.png
加载你的规则样例复制那里报错了
换成定位标志映射没问题
你再去试试看

举报 使用道具
lucky半杯 中级会员 发表于 2017-5-3 15:13:19 | 显示全部楼层
HJLing 发表于 2017-5-3 14:34
加载你的规则样例复制那里报错了
换成定位标志映射没问题
你再去试试看

那我  翻页可以成功,但是不能抓第二页数据
举报 使用道具
lucky半杯 中级会员 发表于 2017-5-3 15:15:57 | 显示全部楼层
HJLing 发表于 2017-5-3 14:34
加载你的规则样例复制那里报错了
换成定位标志映射没问题
你再去试试看

而且我这个不知道为什么,直接将第一页全部抓取,我明明只映射第一个样本。而且微博后几个样本的结构不同,存在于EM中的DIV中

QO[U5~MYURDQ2N`$5JM)]NP.png
举报 使用道具
HJLing 版主 发表于 2017-5-3 15:22:24 | 显示全部楼层
lucky半杯 发表于 2017-5-3 15:15
而且我这个不知道为什么,直接将第一页全部抓取,我明明只映射第一个样本。而且微博后几个样本的结构不同 ...

QQ截图20170503152146.png
为什么翻页不是用当前主题

举报 使用道具
lucky半杯 中级会员 发表于 2017-5-3 16:13:03 | 显示全部楼层
HJLing 发表于 2017-5-3 15:22
为什么翻页不是用当前主题

这个我后来修改了,感谢。问下,为什么我用你们的微薄修改工具,过一会就说采集完成,明明有那么多条
举报 使用道具
HJLing 版主 发表于 2017-5-3 16:27:29 | 显示全部楼层
lucky半杯 发表于 2017-5-3 16:13
这个我后来修改了,感谢。问下,为什么我用你们的微薄修改工具,过一会就说采集完成,明明有那么多条
...

看一下微博有没有登录
浏览器能不能访问你要采集的页面

举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-3-29 17:08