规则名:智联招聘_公司职位信息_8.29
问题:我采用的是连续动作操作,直接跳转到另一个页面,爬虫日志显示超时


规则名:智联招聘_连续动作_8.29
问题:我加了条件限制:爬出了35个xml,网页上显示只有33页


举报 使用道具
| 回复

共 3 个关于本帖的回复 最后回复于 2017-8-29 15:09

沙发
shengchengx 金牌会员 发表于 2017-8-29 14:50:14 | 只看该作者
你发的规则名和你截图的规则好像不一样呢,上面映射有问题。

举报 使用道具
板凳
Shuquan 中级会员 发表于 2017-8-29 15:00:01 | 只看该作者
规则名:
智联招聘_公司详细信息_8.29
举报 使用道具
地板
shengchengx 金牌会员 发表于 2017-8-29 15:09:04 | 只看该作者
Shuquan 发表于 2017-8-29 15:00
规则名:
智联招聘_公司详细信息_8.29

这个有独立网址的话直接做一个样例复制就好了,然后做下级线索,不用做连续动作的。
这些div都是有规律的,直接选择第一个div做样例复制。

然后现在下一个的这个div做第二个样例复制。
最终效果是这样的。


举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-19 13:37