技术大神想咨询个问题,在二级爬取后还想进行三级爬取,但第三级网站可能没有那么统一,这时候怎么定义第三级?像这种情况能爬吗?
举报 使用道具
| 回复

共 2 个关于本帖的回复 最后回复于 2019-7-13 23:32

沙发
Fuller 管理员 发表于 2019-7-13 22:39:20 | 只看该作者
用爬虫做的规则相当于一个模板,如果第三级不统一,就没法做模板。除非想把整个网页内容存下来,这个可以做的很通用,把整个body节点映射给抓取内容就行。但是,如果要抓取一个个字段,就不好做成通用的规则
举报 使用道具
板凳
fred590 初级会员 发表于 2019-7-13 23:32:54 | 只看该作者
Fuller 发表于 2019-7-13 22:39
用爬虫做的规则相当于一个模板,如果第三级不统一,就没法做模板。除非想把整个网页内容存下来,这个可以做 ...

明白了,谢谢

举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 为什么用微软的excel无法打开xls文件?powe
  • 360或火绒等杀毒软件导致GooSeeker爬虫软件
  • 话题分析(NMF模型和LDA模型)软件的安装和
  • 运行Apple无法验证的程序的方法
  • 文本聚类分析软件的安装和使用方法

热门用户

GMT+8, 2025-7-13 07:53