Fuller 管理员 发表于 2016-8-5 18:04:15 | 显示全部楼层
ray_zhurui 发表于 2016-8-5 17:56
我用记号线索,然后在@class节点点鼠标右键绑定了记号映射。保存规则后提示没有做线索定位规则为什么? ...

有两种线索:
1,定点线索:只做线索映射就可以了
2,记号线索:要做记号映射,还要做线索映射,线索映射的目的是在网页上定一个区域,在这个区域中找记号,这样就会很精准,可以参看:http://www.gooseeker.com/doc/thread-1468-1-1.html
举报 使用道具
ray_zhurui 中级会员 发表于 2016-8-5 18:23:13 | 显示全部楼层
Fuller 发表于 2016-8-5 18:04
有两种线索:
1,定点线索:只做线索映射就可以了
2,记号线索:要做记号映射,还要做线索映射,线索映射 ...

已经在翻页按钮对应的@class上一项attributs选择了定位线索1,保存后成功,但是还没捉出来数据哦。
举报 使用道具
Fuller 管理员 发表于 2016-8-5 19:38:10 | 显示全部楼层
ray_zhurui 发表于 2016-8-5 18:23
已经在翻页按钮对应的@class上一项attributs选择了定位线索1,保存后成功,但是还没捉出来数据哦。 ...

规则名发出来我们看看
举报 使用道具
ray_zhurui 中级会员 发表于 2016-8-5 21:22:10 | 显示全部楼层
Fuller 发表于 2016-8-5 19:38
规则名发出来我们看看

主题名?搜testpro
举报 使用道具
Fuller 管理员 发表于 2016-8-5 23:13:53 | 显示全部楼层

两个要用不同的规则名,比如,第一个是testpro_1,第二个是testpro_2

你用相同的名字,只是规则编号不同,这种用法不对,做了动作以后,肯定还会有第一个规则,因为第一个规则没有创建整理箱,没有设置关键内容,那么他能适用于所有网页。

是否适用,主要看整理箱中的关键内容是否能定位到。如果没有关键内容,那么他总是适用
举报 使用道具
ray_zhurui 中级会员 发表于 2016-8-5 23:15:12 | 显示全部楼层
Fuller 发表于 2016-8-5 23:13
两个要用不同的规则名,比如,第一个是testpro_1,第二个是testpro_2

你用相同的名字,只是规则编号不同 ...

我在看看。。。
举报 使用道具
ray_zhurui 中级会员 发表于 2016-8-5 23:19:51 | 显示全部楼层
Fuller 发表于 2016-8-5 23:13
两个要用不同的规则名,比如,第一个是testpro_1,第二个是testpro_2

你用相同的名字,只是规则编号不同 ...

我要改成两个不一样的主题名?这样爬虫怎么知道动作的先后顺序?
举报 使用道具
ray_zhurui 中级会员 发表于 2016-8-5 23:28:41 | 显示全部楼层
Fuller 发表于 2016-8-5 23:13
两个要用不同的规则名,比如,第一个是testpro_1,第二个是testpro_2

你用相同的名字,只是规则编号不同 ...

我想重新加载规则_2对应的主题testpro并试图改名为testpro2时,出现报错:
加载抓取规则遇到的错误:
无法定位容器 No.0
无法定位抓取内容 No.1 (情景2);XPath是td[position()=4]
无法定位抓取内容 No.2 (情景2);XPath是td[position()=5]
无法定位抓取内容 No.3 (情景2);XPath是td[position()=6]

加载爬虫路线遇到的错误:
无法定位定点线索0;定位用XPath:<context>//*[@id='next_t']/span</context>;原因:DOM节点名错误:SPAN
举报 使用道具
ray_zhurui 中级会员 发表于 2016-8-5 23:40:40 | 显示全部楼层
Fuller 发表于 2016-8-5 23:13
两个要用不同的规则名,比如,第一个是testpro_1,第二个是testpro_2

你用相同的名字,只是规则编号不同 ...

另外如果把主题名改成两个的话,爬虫怎么知道是在同一个网页的先后进行爬取?
举报 使用道具
ray_zhurui 中级会员 发表于 2016-8-5 23:47:45 | 显示全部楼层
Fuller 发表于 2016-8-5 23:13
两个要用不同的规则名,比如,第一个是testpro_1,第二个是testpro_2

你用相同的名字,只是规则编号不同 ...

还在么。。。
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-3-29 09:48