集搜客GooSeeker网络爬虫

标题: 微博展开全文下的抓取 [打印本页]

作者: tt370498563    时间: 2016-3-22 09:44
标题: 微博展开全文下的抓取
现在微博不限字数了,有很多微博总是有“展开全文”,然后以下内容不显示,不知道如何抓取展开以下的内容,请大神赐教!

据说可以像翻页那样设置一个线索,可是我设置了记号线索后就翻不了页了。
作者: Fuller    时间: 2016-3-22 09:58
请看这个跟帖:http://www.gooseeker.com/doc/thread-1549-1-1.html
作者: wangyong    时间: 2021-1-29 10:56

集搜客微博采集工具箱中通过微博关键词搜索结果采集工具微博博主主页采集工具或者其他微博工具采集微博数据时会采集下带有“展开全文”的数据

在采集结果中通过Excel将含有“展开全文”的数据筛选出来后
[attach]13602[/attach]

将其对应的“博文独立网址”添到微博博文展开全部采集中就可以将“展开全文”后的数据完整采集下来
[attach]13603[/attach]

数据展示:

[attach]13604[/attach]





欢迎光临 集搜客GooSeeker网络爬虫 (https://www.gooseeker.com/doc/) Powered by Discuz! X3.2