这个是照着做的教程http://www.gooseeker.com/doc/article-437-1.html
这个是我做的规则
层级1怠惰20190505073346
层级2怠惰20190505074633
好像是没有点击成功,请指教
举报 使用道具
| 回复

共 11 个关于本帖的回复 最后回复于 2019-5-5 08:49

沙发
Fuller 管理员 发表于 2019-5-5 08:27:16 | 只看该作者
你的两级规则主题名分别是什么?
举报 使用道具
板凳
Fuller 管理员 发表于 2019-5-5 08:29:45 | 只看该作者
规则找到了,我看看
举报 使用道具
地板
safa78 初级会员 发表于 2019-5-5 08:31:26 | 只看该作者
Fuller 发表于 2019-5-5 08:27
你的两级规则主题名分别是什么?

上面的层级1 层级2
举报 使用道具
5#
Fuller 管理员 发表于 2019-5-5 08:32:25 | 只看该作者
你在爬虫路线工作台上定位选项设置了绝对定位,京东这样的电商网站肯定不行,网页结构即使没有大改变也会时时发生小变化,比如,插入一句广告,绝对定位的规则就失效了
举报 使用道具
6#
safa78 初级会员 发表于 2019-5-5 08:33:52 | 只看该作者
Fuller 发表于 2019-5-5 08:32
你在爬虫路线工作台上定位选项设置了绝对定位,京东这样的电商网站肯定不行,网页结构即使没有大改变也会时 ...

一开始默认是偏好id的,我试了不行所以就改绝对定位试试看,刚刚我试了下好像可以抓到了,怎么改的
举报 使用道具
7#
safa78 初级会员 发表于 2019-5-5 08:39:43 | 只看该作者
打数机运行层级1的时候,能看到模拟点击的效果吗,现在我感觉是没点一直往下这样找到的
举报 使用道具
8#
safa78 初级会员 发表于 2019-5-5 08:42:52 | 只看该作者
我改回偏好id了还是看不到模拟点击的效果
举报 使用道具
9#
Fuller 管理员 发表于 2019-5-5 08:42:58 | 只看该作者

选择偏好id以后,生成的规则还是不太好,里面有太多position函数,适应性不够。原因在于你做指定翻页区映射的时候,选择了商品评论那个tab,那个tab上没有定位标志。可以选择更大范围的,代表翻页区的节点

选择这个做翻页区映射。

但是我发现这个节点的class值还会变化。这样生成的规则还是适应性不强,网页上一会这个class值,一会那个class值,规则只能适应一个。可以手工修改生成的规则,但是要注意顺序,手工修改的规则会被自动生成的规则冲掉。点击“存规则”按钮,会自动生成,所以,手工修改的要在“存规则”之后,用“保存修改”按钮保存。顺序是:
1,做好映射并“存规则”
2,在爬虫路线工作台上,点击“查看规则”
3,在规则上直接修改,把
  1. //*[@class='tab-main large']//li[.//text()="商品评价"]
复制代码
修改成
  1. //*[contains(@class,'tab-main large')]//li[.//text()="商品评价"]
复制代码
这样改以后,class值只要含有tab-main large,就可以匹配上
4,点击“保存修改”按钮
规则就修改好了
举报 使用道具
10#
safa78 初级会员 发表于 2019-5-5 08:44:39 | 只看该作者
噢看到了,还有个问题就是层级1一定要往下结束才执行层级2吗,能不能看到模拟点击的按钮就结束调到层级2
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-27 06:22