快捷导航
就是我需要爬取很多个项目的对应的所有讨论板块内的讨论帖的评论内容,总共要给每个项目做三层嵌套规则。
目前有每个项目的网站链接每个项目都是一样的规则
请问有什么办法可以直接执行批量项目的爬取,而不是我每个项目都要做一遍规则,都进行一次爬取呢?

下图是一个项目的三层爬取
image.png
举报 使用道具
| 回复

共 3 个关于本帖的回复 最后回复于 2023-5-18 12:25

Fuller 管理员 发表于 2023-5-17 15:16:58 | 显示全部楼层
给规则中添加不同项目的链接,就可以了,看这个教程https://www.gooseeker.com/doc/article-526-1.html
举报 使用道具
Fuller 管理员 发表于 2023-5-17 15:17:55 | 显示全部楼层
如果每个项目的网页结构是一样的,那么在第一级规则中加入其他项目的网址
截图2.png
举报 使用道具
zeng111 初级会员 发表于 2023-5-18 12:25:24 | 显示全部楼层
Fuller 发表于 2023-5-17 15:17
如果每个项目的网页结构是一样的,那么在第一级规则中加入其他项目的网址

...

好的谢谢已解决
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 如何采集微博博主主页并生成共现矩阵用于Ge
  • Gephi社会网络分析-网络图Force Atlas布局
  • 对共词关系求协方差矩阵后再用Girvan-Newma
  • 社区发现算法Girvan-Newman(GN)是否能应用
  • 使用GooSeeker分词和Gephi进行中文文本分析

热门用户

GMT+8, 2023-9-28 16:00