既有分类

既有分类

上面有分类,国际、等等

又有翻页器,翻页器下一页还不是文字

又有翻页器,翻页器下一页还不是文字

下面又有分页器,下一页 按钮里面不是文本 是 箭头
这种情况怎么爬取,怎么设计规则????
举报 使用道具
| 回复

共 3 个关于本帖的回复 最后回复于 2020-5-9 09:11

Fuller 管理员 发表于 2020-5-9 07:30:18 | 显示全部楼层
通常分类是有独立网址的,那么就要层级采集先采集每个分类的网址,形成下一级,参看:《采集网址做层级采集》。
翻页标志既可以是文字,也可以是其他符号,参看:《没有文本记号进行翻页
举报 使用道具
jiaolinyu123 新手上路 发表于 2020-5-9 09:03:34 | 显示全部楼层
Fuller 发表于 2020-5-9 07:30
通常分类是有独立网址的,那么就要层级采集先采集每个分类的网址,形成下一级,参看:《采集网址做层级采集 ...

我点击不同的分类了,但是地址没有变化
举报 使用道具
Fuller 管理员 发表于 2020-5-9 09:11:07 | 显示全部楼层
jiaolinyu123 发表于 2020-5-9 09:03
我点击不同的分类了,但是地址没有变化

如果没有独立网址,第一级负责点击分类,进入第二级负责翻页抓取。

点击动作的教程:https://www.gooseeker.com/doc/article-288-1.html
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-3-29 18:50