举报 使用道具
| 回复

共 7 个关于本帖的回复 最后回复于 2016-1-6 16:39

沙发
xandy 论坛元老 发表于 2016-1-6 16:24:30 | 只看该作者
你用上 position()函数,都限定死了,所以只有一个。
举报 使用道具
板凳
驻在冰箱的企鹅菌 中级会员 发表于 2016-1-6 16:29:29 | 只看该作者
xandy 发表于 2016-1-6 16:24
你用上 position()函数,都限定死了,所以只有一个。

那我该怎么改呢?
举报 使用道具
地板
xandy 论坛元老 发表于 2016-1-6 16:30:14 | 只看该作者

用属性值去定位就能找到多个了,先去学习一下xpath的基本知识,百度就有xpath教程,xpath不是Gooseeker特有的,是通用的网页程序。
举报 使用道具
5#
驻在冰箱的企鹅菌 中级会员 发表于 2016-1-6 16:34:32 | 只看该作者
我已经完成图中1 部分的位置设定。但1点了以后还有2中的子分类,我实际想采集的是元素1至n下的子元素1至n 中的值,所以其实要模拟两步点击,软件支持吗?
举报 使用道具
6#
xandy 论坛元老 发表于 2016-1-6 16:35:14 | 只看该作者
驻在冰箱的企鹅菌 发表于 2016-1-6 16:34
我已经完成图中1 部分的位置设定。但1点了以后还有2中的子分类,我实际想采集的是元素1至n下的子元素1至n  ...

支持,你建两个点击动作就行了。
举报 使用道具
7#
驻在冰箱的企鹅菌 中级会员 发表于 2016-1-6 16:38:34 | 只看该作者
现在我已经完成了2次点击+多页面抓取的行为,但是有个问题。能不能在网页信息里面记录抓取的网页是在什么点击条件下生成的。比如:这个模拟点击 第一步点击了什么 第二步点击了什么,因为这才好分类。
举报 使用道具
8#
xandy 论坛元老 发表于 2016-1-6 16:39:53 | 只看该作者
驻在冰箱的企鹅菌 发表于 2016-1-6 16:38
现在我已经完成了2次点击+多页面抓取的行为,但是有个问题。能不能在网页信息里面记录抓取的网页是在什么点 ...

看看属性值是否不同,不同的话做定位标志映射。把绿色字体的类别抓下来就行了。

0106只能找到一个5.png (4.76 KB, 下载次数: 503)

0106只能找到一个5.png
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-27 07:36