你好,我想使用微博博主博文信息采集功能,请问是只有文本信息能被抓取吗?如果单条微博里有表情,链接,还发了图片,是不是就不能抓取?只能抓取文字?


举报 使用道具
| 回复

共 4 个关于本帖的回复 最后回复于 2017-2-21 18:53

沙发
HJLing 版主 发表于 2017-2-21 17:30:38 | 只看该作者
微博表情不能采集
链接图片可以采集 但是 链接不是规整的 可能一条微博带了几个链接 你可以尝试把内容都采下来 再清洗出那些链接 有些麻烦
举报 使用道具
板凳
Athena092 新手上路 发表于 2017-2-21 17:57:16 | 只看该作者
HJLing 发表于 2017-2-21 17:30
微博表情不能采集
链接图片可以采集 但是 链接不是规整的 可能一条微博带了几个链接 你可以尝试把内容都采 ...

微博表情不是也是文本信息吗一般显示为:[微笑]这样。。
举报 使用道具
地板
HJLing 版主 发表于 2017-2-21 18:00:50 | 只看该作者
Athena092 发表于 2017-2-21 17:57
微博表情不是也是文本信息吗一般显示为:[微笑]这样。。

是 只能采这样的 不能把表情采下来

举报 使用道具
5#
Athena092 新手上路 发表于 2017-2-21 18:53:40 | 只看该作者
HJLing 发表于 2017-2-21 18:00
是 只能采这样的 不能把表情采下来

好的!谢谢你!
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-25 23:08