微博爬虫时,如何使采集的excel表格中不含话题,而只含微博正文? 1.png 2.png
举报 使用道具
| 回复

共 6 个关于本帖的回复 最后回复于 2021-4-1 15:35

Fuller 管理员 发表于 2021-3-31 23:26:14 | 显示全部楼层
在excel中可以过滤
举报 使用道具
zhangfg123456 新手上路 发表于 2021-4-1 10:06:50 | 显示全部楼层
Fuller 发表于 2021-3-31 23:26
在excel中可以过滤

那大概怎么操作呢?
举报 使用道具
Fuller 管理员 发表于 2021-4-1 11:11:53 | 显示全部楼层
zhangfg123456 发表于 2021-4-1 10:06
那大概怎么操作呢?

最简单的方法是对excel中的内容进行排序,那么,话题内容一般都会排序后在一起,就可以选中这些行,删除行
举报 使用道具
zhangfg123456 新手上路 发表于 2021-4-1 11:17:51 | 显示全部楼层
Fuller 发表于 2021-4-1 11:11
最简单的方法是对excel中的内容进行排序,那么,话题内容一般都会排序后在一起,就可以选中这些行,删除 ...

那样的话微博正文不也被删除了吗?我想做到的是只删除话题标签,话题标签和微博正文在同一个单元格里
举报 使用道具
Fuller 管理员 发表于 2021-4-1 11:45:43 | 显示全部楼层
zhangfg123456 发表于 2021-4-1 11:17
那样的话微博正文不也被删除了吗?我想做到的是只删除话题标签,话题标签和微博正文在同一个单元格里
...

在excel中使用替换功能,把话题用空字符串替换
举报 使用道具
zhangfg123456 新手上路 发表于 2021-4-1 15:35:50 | 显示全部楼层
Fuller 发表于 2021-4-1 11:45
在excel中使用替换功能,把话题用空字符串替换

试了下,可以通过将“#*#”替换为“”,把话题标签去掉,感谢管理员~
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-3-29 01:57