Fuller 管理员 发表于 2019-4-11 21:52:18 | 显示全部楼层
goodhanbin 发表于 2019-4-11 21:40
但是,如果不点浏览次数,就没办法,调出窗口,采集访客时间

凡是点出来窗口以后,要采集的数据只能属于这个窗口的,不能用这个规则同时采集覆盖的下面的窗口的内容
举报 使用道具
goodhanbin 中级会员 发表于 2019-4-11 22:57:15 | 显示全部楼层
那怎么解决,建两个规则或是使用连续动作吗
举报 使用道具
goodhanbin 中级会员 发表于 2019-4-12 00:00:32 | 显示全部楼层
Fuller 发表于 2019-4-11 21:52
凡是点出来窗口以后,要采集的数据只能属于这个窗口的,不能用这个规则同时采集覆盖的下面的窗口的内容
...

如何,将两个 窗口的内容合并到一个表头,
举报 使用道具
Fuller 管理员 发表于 2019-4-12 08:27:09 | 显示全部楼层
goodhanbin 发表于 2019-4-12 00:00
如何,将两个 窗口的内容合并到一个表头,

用excel的vlookup函数,参看:https://www.gooseeker.com/doc/article-478-1.html
举报 使用道具
goodhanbin 中级会员 发表于 2019-4-12 13:59:42 | 显示全部楼层
有两个问题哈:
问题一,执行一级规则爬数据,是否会带动二级规则?一级规则数据导出之后,不包含二级页面数据,二级页面,只是一个窗口,非连接;

问题二,二级规则,执行爬数据,报错:无法定位到容器,

由于,二级页面是窗口,非连接,只能作连续动作,动作一:点击浏览次数,跳出窗口,采集标签数据 ,动作二:关闭窗口

二级规则窗口

二级规则窗口

一级规则窗口

一级规则窗口举报 使用道具
goodhanbin 中级会员 发表于 2019-4-13 08:43:38 | 显示全部楼层
Fuller 发表于 2018-7-18 12:53
如果用 ./text()作为内容表达式,采集到的数据将是3这个数字,用来匹配第一和第二级不太容易,因为可能别 ...

两级规则中:规则一和规则二数据导出来之后,有如下问题:

第一,规则二,数据有很多空白处,见下图


第二,规则二,产生数据比规则一多,见下图是和规则一和规则二采集界面

规则一和规则二界面

规则一和规则二界面

规则二:空白处多,并且规则二比规则一数据多

规则二:空白处多,并且规则二比规则一数据多
举报 使用道具
goodhanbin 中级会员 发表于 2019-4-13 12:04:58 | 显示全部楼层
Fuller 发表于 2019-4-11 18:41
要做3级规则:
第一级:采集“我的访客”列表,并且做点击,逐个点击每个访客,目标主题指向第二级。
我 ...

急!!二级规则里,跳出一个窗口,有多个来访时间,如何设置,只采集第一条:来访时间,

二级窗口,多个来访时间

二级窗口,多个来访时间
举报 使用道具
Fuller 管理员 发表于 2019-4-13 16:39:13 | 显示全部楼层
goodhanbin 发表于 2019-4-13 12:04
急!!二级规则里,跳出一个窗口,有多个来访时间,如何设置,只采集第一条:来访时间,

...

有多条的话,如果只想要第一条,就不要做样例复制。

如果没有做样例复制,就已经采集下来多条了,那说明生成规则的时候自动使用了定位标志采集列表数据,如果不想采集多条,那么给最顶层的容器节点做手工的定位标志映射,每一条信息的共同父节点,如果有class或者id,就用它做定位标志映射,如果他没有,再往祖先节点方向找
举报 使用道具
goodhanbin 中级会员 发表于 2019-4-13 17:31:44 | 显示全部楼层
有做定位标志映射,详情附件图片

定位标志映射

定位标志映射
举报 使用道具
goodhanbin 中级会员 发表于 2019-4-13 22:04:25 | 显示全部楼层
Fuller 发表于 2019-4-13 16:39
有多条的话,如果只想要第一条,就不要做样例复制。

如果没有做样例复制,就已经采集下来多条了,那说明 ...

第二个问题哈:
导出数据后,每页二级规则数据比一级规则数据少8条,二级规则数据只导出,每一页第一条数据,这是哪儿出了问题?如何解决,急盼回复!谢谢哈
1.连续动作,有设置关闭窗口
2.采集数据界面,逐条采集的
采集数据动作和二级数据表格见下表
来访时间步骤动态图20190413212918.gif
二级规则数据0413.png
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-22 20:22