网址:
http://market.vin114.net/zfcaf/l ... c3adb1582169a9ffcf1
帐号:npcayu

1

1

动作是点击这一行,
顺带抓出这一行的4个text,这一行是UL ,4个TEXT在下面4个LI下的4个P下。

2

2




举报 使用道具
| 回复

共 8 个关于本帖的回复 最后回复于 2018-8-22 17:58

Fuller 管理员 发表于 2018-8-21 10:26:43 | 显示全部楼层
上面那4个LI,对应4行查询结果数据吗?
举报 使用道具
Fuller 管理员 发表于 2018-8-21 10:30:10 | 显示全部楼层
你做点击动作的目的是什么?是要点击以后进入到某个型号的详情页吗?

如果只是为了抓取本页的4个数据,不用再做点击了
举报 使用道具
npcayu 初级会员 发表于 2018-8-22 15:56:18 | 显示全部楼层
Fuller 发表于 2018-8-21 10:30
你做点击动作的目的是什么?是要点击以后进入到某个型号的详情页吗?

如果只是为了抓取本页的4个数据,不 ...

这个页面的结果是两行,2个UL.....
我要点击每一个UL 进入下级页面抓结果,同时要保留点击的UL里的数值,,,,,UL的数值是每个UL/LI/P/TEXT、、但是这个LI有4个,因为有4列
而且内容表达式是赋值给 ACTIONVALUE.1个任务里,只能用一次么?能不能4个连续动作,4个内容表达式呢

举报 使用道具
Fuller 管理员 发表于 2018-8-22 16:33:03 | 显示全部楼层
npcayu 发表于 2018-8-22 15:56
这个页面的结果是两行,2个UL.....
我要点击每一个UL 进入下级页面抓结果,同时要保留点击的UL里的数值, ...

actionvalue能存所有动作的,用-+-间隔开,但是整个actionvalue的长度有限制,太长了会截断,最长是250个字符
举报 使用道具
Fuller 管理员 发表于 2018-8-22 16:34:35 | 显示全部楼层
Fuller 发表于 2018-8-22 16:33
actionvalue能存所有动作的,用-+-间隔开,但是整个actionvalue的长度有限制,太长了会截断,最长是250个 ...

actionvalue是记录点击位置的信息的,比如,一些动态的信息,用抓取规则抓不到的。比如。SELECT选了哪个OPTION,INPUT中输入了什么值,这些适合用actionvalue记录,而静态的网页上的内容,可以用xpath抓取的,就定义抓取内容,做内容映射
举报 使用道具
npcayu 初级会员 发表于 2018-8-22 17:24:19 | 显示全部楼层
Fuller 发表于 2018-8-22 16:34
actionvalue是记录点击位置的信息的,比如,一些动态的信息,用抓取规则抓不到的。比如。SELECT选了哪个O ...

我已经发现ACTIONVALUE里面的+号的秘密了。5个连续动作就有5个+号,这个已经没有问题了
现在的问题是
1.png
这个动作是点击这个UL.然后进去下级页面,同时要记录这个UL的内容
内容分4列,是4个LI.,,,如何在一个动作的内容表达式里面同时输出4个TEXT呢,。
求指教。谢谢

举报 使用道具
Fuller 管理员 发表于 2018-8-22 17:33:32 | 显示全部楼层
npcayu 发表于 2018-8-22 17:24
我已经发现ACTIONVALUE里面的+号的秘密了。5个连续动作就有5个+号,这个已经没有问题了
现在的问题是

通常我们不记录这么细,而是记录第几个编号。

在第一级,先把多个UL采集下来,当成整理箱的内容进行采集,做一个样例复制,多个UL就采集下来了,其实根据排序就知道了他们各自的序号。

第二级是点击后进入的详情页,在这个结果文件中会有actionno,就知道是点击了第几个UL

当整合处理两级规则的抓取结果的时候,就把他们匹配起来了。

放在actionvalue中,有长度限制,可能会放不下
举报 使用道具
npcayu 初级会员 发表于 2018-8-22 17:58:38 | 显示全部楼层
Fuller 发表于 2018-8-22 17:33
通常我们不记录这么细,而是记录第几个编号。

在第一级,先把多个UL采集下来,当成整理箱的内容进行采集 ...

好吧,如果只能这样的话,多谢。

举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-3-29 09:06