规则名:ipcrainpat
麻烦帮我看一下:ipc.rainpat.com这个网页我为什么不能从H项开始采集?谢谢



举报 使用道具
| 回复

共 14 个关于本帖的回复 最后回复于 2017-6-6 18:13

沙发
wangyong 版主 发表于 2017-6-5 11:17:25 | 只看该作者
从H项开始采连续动作的xpath需要直接定位到H项的节点
xpath:
  1. //*[@class='datagrid-btable']/tbody/tr[8]/td[1]/div/span[1]
复制代码


举报 使用道具
板凳
hblemon2008 高级会员 发表于 2017-6-5 11:49:35 | 只看该作者
不是用连续动作吗?
定位表达式为://*[@class='tree-hit tree-collapsed' or @class='tree-hit tree-expanded'],然后在高级设置里把起点设置为8,跨度设置为1
举报 使用道具
地板
wangyong 版主 发表于 2017-6-5 11:55:07 | 只看该作者
这样点不到H节点?
举报 使用道具
5#
hblemon2008 高级会员 发表于 2017-6-5 13:57:36 | 只看该作者
只能点开H节点,然后就不再继续,采集完成
举报 使用道具
6#
wangyong 版主 发表于 2017-6-5 14:00:03 | 只看该作者
继续是想让爬虫继续做什么?
举报 使用道具
7#
hblemon2008 高级会员 发表于 2017-6-5 14:33:06 | 只看该作者
继续点开下面的节点,然后依次采集
举报 使用道具
8#
wangyong 版主 发表于 2017-6-5 14:41:24 | 只看该作者
做下面节点的点击动作,动作规则和采集规则要分两个规则参看教程:《设计连续动作流程》
举报 使用道具
9#
hblemon2008 高级会员 发表于 2017-6-5 14:54:33 | 只看该作者
我前面的A至G类都用连续动作采集成功了
举报 使用道具
10#
hblemon2008 高级会员 发表于 2017-6-6 09:36:02 | 只看该作者
因为从A至H每一类的采集量都很大,不分类采集的话,首先有可能数据漏采集,另外采集的速度会随着采集量的增大而越来越慢,还有其他的解决方案吗?
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-27 04:25