规则名:广州数据分析岗_猎聘

一共有100页,抓到84页停止了,显示抓取失败(超时),抓取规则不合适

试了2次都一样在84页。

在线求救~~~~~~~~
举报 使用道具
| 回复

共 3 个关于本帖的回复 最后回复于 2018-7-26 09:10

沙发
Arie-X 中级会员 发表于 2018-7-25 21:41:23 | 只看该作者
手工翻到84页,可以看到84页的网页结构和前面的有很大不同,当然前面的规则就不适用了。可以一个主题名下建立多个规则,对84页再做一个规则。
举报 使用道具
板凳
kentlost 初级会员 发表于 2018-7-25 23:17:40 | 只看该作者
Arie-X 发表于 2018-7-25 21:41
手工翻到84页,可以看到84页的网页结构和前面的有很大不同,当然前面的规则就不适用了。可以一个主题名下建 ...

做了多个规则,从84页开始第二规则爬。到94页的时候,有两种规则的网页结构,结果又停止了……
举报 使用道具
地板
Fuller 管理员 发表于 2018-7-26 09:10:30 | 只看该作者
kentlost 发表于 2018-7-25 23:17
做了多个规则,从84页开始第二规则爬。到94页的时候,有两种规则的网页结构,结果又停止了…… ...

还可以建立更多的规则,不过,我建议对比一下94页前后的变化,调整规则,让规则的适应性更高。通常,用上定位标志映射是能大幅度提高适应性。参看:https://www.gooseeker.com/doc/article-344-1.html
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-23 15:59