主题:三明预售_2


测试输入信息属于正常的,保存时出现这个错误但是为什么出现:“映射给记号的节点没有包容在映射给线索的节点内部”
举报 使用道具
| 回复

共 18 个关于本帖的回复 最后回复于 2016-12-7 17:24

zhuohui1987 金牌会员 发表于 2016-12-6 17:52:13 | 显示全部楼层
测试属于正常,真的抓数据的失败。 帮我 看一看
举报 使用道具
Fuller 管理员 发表于 2016-12-6 18:00:13 | 显示全部楼层
这个规则我加载不了,有错误,错误提示是: 记号线索规则错误.PNG


我猜你做线索定位映射的时候,使用了text节点,这个不对,定位映射的目的是划定一个网页范围,好在这个范围内找点击的记号,所以,这个翻页应该是一个DIV之类的节点。

我是这样映射的:
点击懂.png
举报 使用道具
zhuohui1987 金牌会员 发表于 2016-12-6 18:33:17 | 显示全部楼层
Fuller 发表于 2016-12-6 18:00
这个规则我加载不了,有错误,错误提示是:

还是一样的啊

举报 使用道具
zhuohui1987 金牌会员 发表于 2016-12-6 18:35:35 | 显示全部楼层
Fuller 发表于 2016-12-6 18:00
这个规则我加载不了,有错误,错误提示是:

QQ图片20161206130521.png QQ图片20161206183100.png   
还是这个错误: 映射给记号的节点没有包容在映射给线索的节点内部
举报 使用道具
Fuller 管理员 发表于 2016-12-6 19:08:02 | 显示全部楼层
zhuohui1987 发表于 2016-12-6 18:35
还是这个错误: 映射给记号的节点没有包容在映射给线索的节点内部

应该用两个规则,否则,总是加载失败。因为,网页刚刚加载的时候,幢信息还没有点开,你的规则里面是要抓幢信息的,此时加载不成功。所以分成两个规则。

规则一:整理箱中不要 许可列表 整个分支,规则一只是在爬虫路线里面做点击

规则二: 是点击后的规则,专门抓 幢信息

我用两个规则已经测试成功。

但是第一个规则那里总是加载不成功,还在查原因,不过不影响爬虫
举报 使用道具
Fuller 管理员 发表于 2016-12-6 19:18:40 | 显示全部楼层
映射关系.png

做记号映射的时候,不用选择onclick,而是选择 id,像上图那样,加载就不会失败,也能抓取。我估计onclick中含有一些""这样的符号,不符合要求
举报 使用道具
zhuohui1987 金牌会员 发表于 2016-12-7 08:24:49 | 显示全部楼层
Fuller 发表于 2016-12-6 19:18
做记号映射的时候,不用选择onclick,而是选择 id,像上图那样,加载就不会失败,也能抓取。我估计onclic ...

另外写在规则二: 是点击后的规则,专门抓 幢信息


他会失败,无法获取点后的数据
举报 使用道具
Fuller 管理员 发表于 2016-12-7 09:21:53 | 显示全部楼层
zhuohui1987 发表于 2016-12-7 08:24
另外写在规则二: 是点击后的规则,专门抓 幢信息

我都测试过了,把 许可列表 整个移到规则二。

第二次加载的时候,提示“后续分析”,不要立马分析,而是手工点击 幢信息 那里,点开以后再执行后续分析。

专门设立一个“后续分析”的原因就在这里。要等手工做了动作以后才能后续分析
举报 使用道具
zhuohui1987 金牌会员 发表于 2016-12-7 14:13:15 | 显示全部楼层
Fuller 发表于 2016-12-6 19:18
做记号映射的时候,不用选择onclick,而是选择 id,像上图那样,加载就不会失败,也能抓取。我估计onclic ...

有发现线索,测试正常,但是抓取的时候网页的白,xml里面没有抓到信息
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-3-29 03:43