微博爬虫时,如何使采集的excel表格中不含话题,而只含微博正文?
举报 使用道具
| 回复

共 6 个关于本帖的回复 最后回复于 2021-4-1 15:35

沙发
Fuller 管理员 发表于 2021-3-31 23:26:14 | 只看该作者
在excel中可以过滤
举报 使用道具
板凳
zhangfg123456 新手上路 发表于 2021-4-1 10:06:50 | 只看该作者
Fuller 发表于 2021-3-31 23:26
在excel中可以过滤

那大概怎么操作呢?
举报 使用道具
地板
Fuller 管理员 发表于 2021-4-1 11:11:53 | 只看该作者
zhangfg123456 发表于 2021-4-1 10:06
那大概怎么操作呢?

最简单的方法是对excel中的内容进行排序,那么,话题内容一般都会排序后在一起,就可以选中这些行,删除行
举报 使用道具
5#
zhangfg123456 新手上路 发表于 2021-4-1 11:17:51 | 只看该作者
Fuller 发表于 2021-4-1 11:11
最简单的方法是对excel中的内容进行排序,那么,话题内容一般都会排序后在一起,就可以选中这些行,删除 ...

那样的话微博正文不也被删除了吗?我想做到的是只删除话题标签,话题标签和微博正文在同一个单元格里
举报 使用道具
6#
Fuller 管理员 发表于 2021-4-1 11:45:43 | 只看该作者
zhangfg123456 发表于 2021-4-1 11:17
那样的话微博正文不也被删除了吗?我想做到的是只删除话题标签,话题标签和微博正文在同一个单元格里
...

在excel中使用替换功能,把话题用空字符串替换
举报 使用道具
7#
zhangfg123456 新手上路 发表于 2021-4-1 15:35:50 | 只看该作者
Fuller 发表于 2021-4-1 11:45
在excel中使用替换功能,把话题用空字符串替换

试了下,可以通过将“#*#”替换为“”,把话题标签去掉,感谢管理员~
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-25 18:15