测试地址:http://hotel.qunar.com/city/sany ... 8&QHFP=ZSI0A8852E40
主题名:去哪儿基本信息


为什么同样的操作,样例复制会失败?
1111.jpg


举报 使用道具
| 回复

共 3 个关于本帖的回复 最后回复于 2017-9-1 16:51

bowieD 金牌会员 发表于 2017-8-31 09:21:42 | 显示全部楼层
后续分析你的规则报错“无法定位第二个样例”,该网页选择不同的区块节点时,旁边的地图会随之变化,导致网页内容会变化,所以做样例复制会定位不到第二个样例节点。
要做规则的话,需要先冻结网页结构让它不要变化,点击文件菜单-冻结网页,再点文件菜单-刷新网页机构,就可以开始做规则,做样例复制就能地位到第二个样例节点。
54.jpg
举报 使用道具
guiguzhu 初级会员 发表于 2017-8-31 19:48:45 | 显示全部楼层
bowieD 发表于 2017-8-31 09:21
后续分析你的规则报错“无法定位第二个样例”,该网页选择不同的区块节点时,旁边的地图会随之变化,导致网 ...

好的  感谢解答  这个问题已经解决了  
http://hotel.qunar.com/city/sany ... p;QHFP=ZSI0A8852E40

冒昧问一下
1、  这个页面没有出现自动滚屏  那是如何判断网页内容发生了变化?
右边那边小地图确实发生了变化,这个细节做规则的时候好难辨认,那做规则的时候应该如何辨认

2、对于网页内容没有发生变化的情况,如果还是点击文件菜单-冻结网页,再点文件菜单-刷新网页机构,也许是多次一举,但是这样操作算不算错误???
1.jpg

举报 使用道具
bowieD 金牌会员 发表于 2017-9-1 16:51:38 | 显示全部楼层
1,无论是什么网页,做每一个规则时,最好都做上定位映射,这样爬虫就能精准的抓取需要的信息,避免不必要的错误
2,网页内容没有发生变化的情况,不用冻结页面,这样的操作也不算错误《冻结页面有什么作用?》
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-3-29 22:07