(任务名在图2中,为:清华信息采集第一级、清华信息采集第二级、清华信息采集第三级
请问我要采集一个网站的清华的电子信息领域的设备信息,需要连续动作、翻页和层级采集。
第一级做连续动作,选上清华,电子信息,
第二级就是就选出来的实验设备采集了两条信息(如第一个设备的名称和所属领域等信息),
第三级需要点开这个设备的链接,采集更为详细的信息
但做完之后,运行第一级没问题,
运行第三级,得到的却是清华的各个领域的设备信息,
求怎样只得到电子信息这个领域的设备详情




2.运行界面

2.运行界面

1.要采集的两个方面

1.要采集的两个方面
举报 使用道具
| 回复

共 10 个关于本帖的回复 最后回复于 2019-7-1 14:09

Fuller 管理员 发表于 2019-6-30 20:57:07 | 显示全部楼层
加载你的规则看了,第一级规则的两个动作顺序调换一下,就可以了,先点击电子信息,再点击清华大学。其余没有问题。
举报 使用道具
sancunjiucheng 初级会员 发表于 2019-7-1 09:45:57 | 显示全部楼层
Fuller 发表于 2019-6-30 20:57
加载你的规则看了,第一级规则的两个动作顺序调换一下,就可以了,先点击电子信息,再点击清华大学。其余没 ...

按您的提示修改了,确实第三级搜索的只是电子信息这一个领域的了,
但我统计第三级的线索有七百多个,而实际上我要采集的只有六百多个,
请问这个有影响吗?

举报 使用道具
Fuller 管理员 发表于 2019-7-1 10:03:21 | 显示全部楼层
sancunjiucheng 发表于 2019-7-1 09:45
按您的提示修改了,确实第三级搜索的只是电子信息这一个领域的了,
但我统计第三级的线索有七百多个,而 ...

可能原因有这些:
1,网站上罗列的网址本身就有重复的
2,网址生成线索的时候失败了,我查了一下历史记录,没有你这个任务名的失败
3,第二级抓取结果上报的时候出现了通信错误。

第2和3是网络和爬虫软件不稳定造成的,你可以重新采集一遍第一级和第二级,看看会否补充上一些线索?
举报 使用道具
sancunjiucheng 初级会员 发表于 2019-7-1 10:29:00 | 显示全部楼层
Fuller 发表于 2019-6-30 20:57
加载你的规则看了,第一级规则的两个动作顺序调换一下,就可以了,先点击电子信息,再点击清华大学。其余没 ...

前边是电子信息,搜了一百多个以后又出现其他领域的了
举报 使用道具
sancunjiucheng 初级会员 发表于 2019-7-1 10:29:39 | 显示全部楼层
Fuller 发表于 2019-7-1 10:03
可能原因有这些:
1,网站上罗列的网址本身就有重复的
2,网址生成线索的时候失败了,我查了一下历史记录 ...

好的

举报 使用道具
Fuller 管理员 发表于 2019-7-1 10:51:16 | 显示全部楼层
sancunjiucheng 发表于 2019-7-1 10:29
前边是电子信息,搜了一百多个以后又出现其他领域的了

你手工看看,网站上是不是本来就是这样的,前面已经选对了,说明动作执行是对的。
举报 使用道具
sancunjiucheng 初级会员 发表于 2019-7-1 13:14:13 | 显示全部楼层
Fuller 发表于 2019-7-1 10:03
可能原因有这些:
1,网站上罗列的网址本身就有重复的
2,网址生成线索的时候失败了,我查了一下历史记录 ...

将第三级导出来的图片与EXCEL中的字段信息进行匹配出现问题怎么解决?
按教程将公式根据自己的信息输进去了,
再复制到text中,
但在表中粘贴了没有图片出来是怎么回事??
1.3.png
1.2.jpg
1.1.png
举报 使用道具
wangyong 版主 发表于 2019-7-1 13:47:17 | 显示全部楼层
sancunjiucheng 发表于 2019-7-1 13:14
将第三级导出来的图片与EXCEL中的字段信息进行匹配出现问题怎么解决?
按教程将公式根据自己的信息输进去 ...

从图片截图来看,路径里\PageImgDir重复多写了一次
举报 使用道具
sancunjiucheng 初级会员 发表于 2019-7-1 14:08:50 | 显示全部楼层
sancunjiucheng 发表于 2019-7-1 13:14
将第三级导出来的图片与EXCEL中的字段信息进行匹配出现问题怎么解决?
按教程将公式根据自己的信息输进去 ...

已解决,勿回复了,谢谢
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-3-28 16:35