设置后不翻页
举报 使用道具
| 回复

共 2 个关于本帖的回复 最后回复于 2020-10-14 10:31

来自 3#
wangyong 版主 发表于 2020-10-14 10:31:04 | 只看该作者
使用集搜客微博工具箱中的微博评论&转发内容采集工具,输入微博链接后可以自动采集

输入界面

结果示例

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
沙发
Fuller 管理员 发表于 2016-4-18 21:33:25 | 只看该作者
翻页的集锦:http://www.gooseeker.com/doc/thread-698-1-1.html

至于微博抓取,建议使用现成的微博采集工具箱,因为微博页面上很多动态内容,定义规则比较有难度,评论翻页就是其中一个难点,我记得网页上有三个翻页标志,要点对正确的那一个。

MS谋数台有个节点搜索功能,参看这个:http://www.gooseeker.com/doc/article-130-1.html  ,把你的翻页用的xpath录入到搜索框中,看看能搜到几个DOM节点。DS打数机运行的时候只会使用第一个节点。

建议用现成的微博工具箱吧:http://www.gooseeker.com/land/weibo.html
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 360或火绒等杀毒软件导致GooSeeker爬虫软件
  • 话题分析(NMF模型和LDA模型)软件的安装和
  • 运行Apple无法验证的程序的方法
  • 文本聚类分析软件的安装和使用方法
  • 利用AI阅读和分析文本:扣子COZE记录用户反

热门用户

GMT+8, 2025-4-21 14:37