11#
tanyaohua123 中级会员 发表于 2016-7-24 11:47:25 | 只看该作者
Fuller 发表于 2016-7-16 18:51
把规则名帖出来,管理员帮你看看

规则名是“新闻联播点击动作入口”,想要点击每天的日期,切换到这一天的新闻列表,因为想要收集每一个标题的链接作为下级线索来收集每条新闻。谢谢管理员!
举报 使用道具
12#
Fuller 管理员 发表于 2016-7-24 14:45:49 | 只看该作者
tanyaohua123 发表于 2016-7-24 11:47
规则名是“新闻联播点击动作入口”,想要点击每天的日期,切换到这一天的新闻列表,因为想要收集每一个标 ...

你这个点击动作相对来说容易得多,因为所有日期都展开摆在页面上,只要定位准就行了,你写的xpath差了一点点,应该这么些
  1. //*[@id='n_c']/div/table/tbody/tr/td[not(contains(@class, 'otherday'))]/a/text()
复制代码

把那些灰色的日期跳过去,用not()函数
举报 使用道具
13#
tanyaohua123 中级会员 发表于 2016-7-24 20:47:49 | 只看该作者
Fuller 发表于 2016-7-24 14:45
你这个点击动作相对来说容易得多,因为所有日期都展开摆在页面上,只要定位准就行了,你写的xpath差了一点 ...

这个定位式确实对应了31个节点,但是添加了xpath之后,抓取出来的结果都是1怎么办?不知道是为什么。小白,还请见谅
举报 使用道具
14#
Fuller 管理员 发表于 2016-7-24 23:00:06 | 只看该作者
tanyaohua123 发表于 2016-7-24 20:47
这个定位式确实对应了31个节点,但是添加了xpath之后,抓取出来的结果都是1怎么办?不知道是为什么。小白 ...

抱歉,那个xpath写错了,应该是
  1. //*[@id='n_c']/div/table/tbody/tr/td[not(contains(@class, 'otherday'))]/a
复制代码
因为要做点击动作,xpath只能定位到A节点,不能到A下面的text(),否则,点击动作做不了
举报 使用道具
15#
tanyaohua123 中级会员 发表于 2016-7-24 23:09:42 | 只看该作者
本帖最后由 tanyaohua123 于 2016-7-24 23:13 编辑
回复错了,问题在下面一楼
C:\Users\tanyaohua\Desktop\wxid_5depxk9lc2qm21_1469365805871_50.png
举报 使用道具
16#
tanyaohua123 中级会员 发表于 2016-7-24 23:12:22 | 只看该作者

都是1怎么办?2、3、4、5到31抓不了。加不加text()都这样
举报 使用道具
17#
tanyaohua123 中级会员 发表于 2016-7-24 23:30:35 | 只看该作者
Fuller 发表于 2016-7-24 23:00
抱歉,那个xpath写错了,应该是
因为要做点击动作,xpath只能定位到A节点,不能到A下面的text(),否则, ...

现在可以做点击动作了,十分感谢
举报 使用道具
18#
Fuller 管理员 发表于 2016-7-25 09:19:29 | 只看该作者
tanyaohua123 发表于 2016-7-24 23:12
都是1怎么办?2、3、4、5到31抓不了。加不加text()都这样

在这个规则中,“创建规则”工作台上建立的这个整理箱实际上没有太大作用,有时候为了用一个网页上的标志确保规则能匹配上才建立这一个整理箱。

重复的原因很可能是你定义的样例复制规则不对
举报 使用道具
19#
tanyaohua123 中级会员 发表于 2016-7-25 16:07:51 | 只看该作者
Fuller 发表于 2016-7-25 09:19
在这个规则中,“创建规则”工作台上建立的这个整理箱实际上没有太大作用,有时候为了用一个网页上的标志 ...

现在碰上这样的问题。我设置的第一个动作是点击日期,第二个动作是点击上一个月的箭头。本来想是点击完31个日期之后在点击上一月,达到遍历所有日期的效果,但是,实际是点击完1号就执行了第二个动作,翻到了六月,然后又执行第一个动作,点击了2号,然后再执行第二个动作翻到了上一月5月,再执行第一个动作,点击3号。也就是说成了点击7月1日,6月2日,5月3日……以此类推
举报 使用道具
20#
Fuller 管理员 发表于 2016-7-25 18:04:08 | 只看该作者
如果点击月份放在前面,点击日期放在后面,可以把点击月份的动作设置成不“必做”,意思是只有下一个步骤的所有都做完才做上一个步骤,就像数字进位一样的原理。具体看连续动作中的“必做”:http://www.gooseeker.com/doc/article-141-1.html

就像上图的计数器,如果不勾选“必做”,高位数字不是每次都跳,只有下一位数字要升位的时候才跳,也就是才去做动作

举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-19 14:38