本帖最后由 759924607 于 2016-8-2 14:02 编辑

下图是加载完失败的线索,显示的错误。也就是整理箱的内容,全部定位失败了。线索号(70069442),本来准备找出错误原因,进行调整。但是全部定位失败,也无从下手啊。

这个规则也并不是完全错误的,也有加载成功的线索。我要是一改动,对别的也会造成影响。规则名“页面记录仪”规则编号“淘宝2”。直接从谋数台直接搜索出来,然后加载规则,是完全没问题的。
大神帮分析下是啥原因啊!跪谢!

举报 使用道具
| 回复

共 6 个关于本帖的回复 最后回复于 2016-8-2 18:29

沙发
759924607 高级会员 发表于 2016-8-2 14:03:43 | 只看该作者
1
举报 使用道具
板凳
wangyong 版主 发表于 2016-8-2 15:37:06 | 只看该作者
复杂页面要做定位标志映射,特别是要对整理箱划定抓取范围,看这个教程http://www.gooseeker.com/doc/article-285-1.html
举报 使用道具
地板
Fuller 管理员 发表于 2016-8-2 15:42:12 | 只看该作者
我加载这个规则试了一下,一共三个整理箱,只有两个关键内容,一个是网页标志,一个是“模拟点击”,这么少的关键内容按理说应该通用性很高。

你分析线索号70069442,看到的网页是淘宝的吗?
举报 使用道具
5#
Fuller 管理员 发表于 2016-8-2 15:51:04 | 只看该作者

像我这样修改,给第一个整理箱的容器节点再做一个定位标志映射,在观察数据规则或者校验规则,就能看到变化,规则里面position()=xxx这样的定位函数没有了。


1)每做一个定位标志映射,就在网页上划一个区域,在指定区域里面抓取就更准确。

2)尽量避免position()函数


举报 使用道具
6#
759924607 高级会员 发表于 2016-8-2 18:29:03 | 只看该作者
Fuller 发表于 2016-8-2 15:51
像我这样修改,给第一个整理箱的容器节点再做一个定位标志映射,在观察数据规则或者校验规则,就能看到变 ...

抱歉现在才看到。感谢感谢,的确是这个问题。现在已经解决了!之前我自己找问题,死活也想不出来!感谢!
举报 使用道具
7#
759924607 高级会员 发表于 2016-8-2 18:29:41 | 只看该作者
wangyong 发表于 2016-8-2 15:37
复杂页面要做定位标志映射,特别是要对整理箱划定抓取范围,看这个教程http://www.gooseeker.com/doc/artic ...

谢谢!的确是这个问题引起的!感谢!
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-30 16:57