本帖最后由 smallG 于 2017-1-16 17:24 编辑


A.上图中下拉框选择,1.设置连续动作(选择);2.设置采集字段映射;

B.如何随下拉框选择的内容,采集当前选择的内容;

C.采集的数据名称无变化 总是采集第一个映射的内容;
采集网址  http://autocat.gates.cn/App/CarSearch?brand=阿斯顿.马丁

主题名:盖茨车型库动作1;盖茨车型库动作2



本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
| 回复

共 8 个关于本帖的回复 最后回复于 2017-1-17 13:48

沙发
Fuller 管理员 发表于 2017-1-16 20:32:20 | 只看该作者
我看了规则2,名称1和名称2,一个用@value做的映射,一个用text做映射,他们的值是一样的,你采集的没有问题。但是,如果你想采集到当时所选的option是哪一个,不能用内容映射,因为内容映射得到的是option静态值,并不能反映当时具体选的是哪一个。

要合理解析连续动作的结果文件获得动态值,具体参看:http://www.gooseeker.com/doc/article-227-1.html
举报 使用道具
板凳
Fuller 管理员 发表于 2017-1-16 20:39:15 | 只看该作者
采集动作施加点的内容有缺省设置,如果需要采集特殊的内容,还可以自己写一个xpath,参看 http://www.gooseeker.com/doc/article-233-1.html 。这时要注意两个词:html的属性和html节点的特性,GS浏览器显示出来的@value, @title都是属性,可以用xpath采集系统,但是,有些内容只出现在特性中,不能用xpath采集,比如,下拉框当前选择了哪个选项,这个值就是SELECT节点的一个特性
举报 使用道具
地板
smallG 初级会员 发表于 2017-1-17 09:55:29 | 只看该作者
Fuller 发表于 2017-1-16 20:39
采集动作施加点的内容有缺省设置,如果需要采集特殊的内容,还可以自己写一个xpath,参看 http://www.goose ...

关于写一个xpath,定位xpath可以在工具中直接生成,请管理给个内容表达式的样例,不会语法和函数
举报 使用道具
5#
smallG 初级会员 发表于 2017-1-17 09:57:11 | 只看该作者
Fuller 发表于 2017-1-16 20:32
我看了规则2,名称1和名称2,一个用@value做的映射,一个用text做映射,他们的值是一样的,你采集的没有问 ...

已经根据这个方法对规则做了修改,目前抓取的数据没有问题,谢谢管理的指导!

修改后抓取的数据,如上图。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
6#
Fuller 管理员 发表于 2017-1-17 10:39:03 | 只看该作者
smallG 发表于 2017-1-17 09:55
关于写一个xpath,定位xpath可以在工具中直接生成,请管理给个内容表达式的样例,不会语法和 ...



网页上可见的内容的xpath不用手写,在浏览器上点击内容,就会定位到一个dom节点,然后选择按钮 显示XPath:偏好class,这个是一组按钮,可以选择其中一个。就能生成xpath。根据需要做些调整。如果用于连续动作的定位,一般是要定位到多个节点,所以,肯定要做修改,因为自动生成的是定位到当前所选的节点。如果要抓取DOM中没有列出来的属性,比如style,就得手工写xpath

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
7#
smallG 初级会员 发表于 2017-1-17 11:18:28 | 只看该作者
Fuller 发表于 2017-1-17 10:39
网页上可见的内容的xpath不用手写,在浏览器上点击内容,就会定位到一个dom节点,然后选择按钮 显示XPa ...



请看下图中内容表达式应填写哪一个定位才是正确的:

1. //*[@class='tblCarSearch']/tbody/tr[position()=3]/td[position()=3]/select/text()
2. /select/option/text()


本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
8#
HJLing 版主 发表于 2017-1-17 11:31:33 | 只看该作者
smallG 发表于 2017-1-17 11:18
请看下图中内容表达式应填写哪一个定位才是正确的:

1. //*[@class='tblCarSearch']/tbody/tr/td/sele ...

选择类型的连续动作 不需要自定义xpath就能把当前选的值采下来的

举报 使用道具
9#
smallG 初级会员 发表于 2017-1-17 13:48:43 | 只看该作者
HJLing 发表于 2017-1-17 11:31
选择类型的连续动作 不需要自定义xpath就能把当前选的值采下来的

好的 明白了!  感谢
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 运行Apple无法验证的程序的方法
  • 文本聚类分析软件的安装和使用方法
  • 利用AI阅读和分析文本:扣子COZE记录用户反
  • 在网页片段内直观标注——以B站评论采集为
  • 利用AI阅读和分析文本:使用COZE建设游记文

热门用户

GMT+8, 2024-12-24 04:20