主题:苏州房产1不知道为什么查询不能查询,麻烦看一下
举报 使用道具
| 回复

共 19 个关于本帖的回复 最后回复于 2018-3-19 09:27

沙发
zhuohui1987 金牌会员 发表于 2018-3-15 21:58:00 | 只看该作者

主题:苏州房产1
举报 使用道具
板凳
Fuller 管理员 发表于 2018-3-15 22:00:14 | 只看该作者

上一级规则名是什么?
举报 使用道具
地板
yangwenge 金牌会员 发表于 2018-3-15 22:03:49 | 只看该作者
本帖最后由 yangwenge 于 2018-3-15 22:05 编辑

1,连续动作的xpath不要使用绝对定位,
动作1可以换成//*[@id='ctl00_MainContent_ddl_RD_CODE'],
动作2可以换成//*[@class='button_style'];
2,连续动作的目标主题名不要随便乱填,需要填写采集规则的主题名;
3,连续动作和采集规则分开做,做成两个规则,一个规则做连续动作,一个规则做采集。
举报 使用道具
5#
zhuohui1987 金牌会员 发表于 2018-3-15 23:04:53 | 只看该作者
问题一:做成两个规则,(苏州房产1)一个规则做连续动作,(苏州房产查询1)一个规则做采集,但是(苏州房产查询1)第二个规则做采集采集不了,?
问题二:苏州房产查询1链接 直接复制到苏州房产查询2链接 的时候居然超时
主题:苏州房产1
主题:苏州房产查询1
举报 使用道具
6#
Fuller 管理员 发表于 2018-3-15 23:16:02 | 只看该作者
zhuohui1987 发表于 2018-3-15 23:04
问题一:做成两个规则,(苏州房产1)一个规则做连续动作,(苏州房产查询1)一个规则做采集,但是(苏州房 ...

我测试了你的规则,能采集
举报 使用道具
7#
yangwenge 金牌会员 发表于 2018-3-15 23:17:20 | 只看该作者
本帖最后由 yangwenge 于 2018-3-15 23:19 编辑

规则都能正常采集,但是采集的链接有问题

这个网站不能用层级抓取,需要用连续动作一个个点开采集,并且需要使用旗舰版的回退功能。
举报 使用道具
8#
zhuohui1987 金牌会员 发表于 2018-3-16 11:24:32 | 只看该作者
yangwenge 发表于 2018-3-15 23:17
规则都能正常采集,但是采集的链接有问题

这个网站不能用层级抓取,需要用连续动作一个个点开采集,并且需 ...


   
小区点击2

   
小区点击1

   
苏州房产查询1



退回功能不要使用在哪里地方 帮我分析一下

举报 使用道具
9#
zhuohui1987 金牌会员 发表于 2018-3-16 11:54:10 | 只看该作者

退回功能不知道要使用在哪里个地方 帮我分析一下
举报 使用道具
10#
bowieD 金牌会员 发表于 2018-3-16 11:56:56 | 只看该作者
本帖最后由 bowieD 于 2018-3-16 11:59 编辑

1、(苏州房产1)一级规则做连续动作去查询,
2、(苏州房产查询1)二级规则采集查询出来的列表信息,还需要定义点击动作去点击项目名称进入详情页,
3、定义三级规则采集详情页的信息,同时需要用回退动作会退到二级规则中来,不过回退动作需要旗舰版以上才有
回退动作是定义在三级规则中,用于回退到规则二,回退层数是1,目标主题名对应二级规则名
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-25 19:26