快捷导航
请问为什么谋数台显示出的xpath比之前多了<context>//*[@id='m']</context>
xpath直接写//*[@id='productMainName']突然定位不到位置了


举报 使用道具
| 回复

共 7 个关于本帖的回复 最后回复于 2020-6-29 14:42

Fuller 管理员 发表于 2016-10-2 15:03:38 | 显示全部楼层
<context>表示这个dom节点位于iframe中,iframe还可以嵌套,表示多层iframe
举报 使用道具
liang616611974 新手上路 发表于 2018-11-8 18:38:27 | 显示全部楼层
哪有什么解决方案吗
举报 使用道具
Fuller 管理员 发表于 2018-11-8 19:14:26 | 显示全部楼层
liang616611974 发表于 2018-11-8 18:38
哪有什么解决方案吗

你遇到的问题是发生在什么时候?

集搜客爬虫把XPath扩展了了一下,增加了<context>,每个<context>代表一个iframe,这个xpath的应用场景是有限制的。可以用在爬虫路线那里,也可以用在连续动作那里。但是不能用在数据规则那里,因为数据规则那里一定是在某个iframe内的,不会跨iframe,所以就用不上<context>
举报 使用道具
ykmbllw 初级会员 发表于 2020-6-28 16:11:26 | 显示全部楼层
Fuller 发表于 2018-11-8 19:14
你遇到的问题是发生在什么时候?

集搜客爬虫把XPath扩展了了一下,增加了,每个代表一个iframe,这个xpa ...

CLASS定位中带了   <context>    怎么把这个数据提取出来     或者怎么写XPANTH  才正确
举报 使用道具
内容分析应用 中级会员 发表于 2020-6-28 17:06:16 | 显示全部楼层
ykmbllw 发表于 2020-6-28 16:11
CLASS定位中带了       怎么把这个数据提取出来     或者怎么写XPANTH  才正确
...

采集iframe中的内容,这是GooSeeker网络爬虫的特色。iframe中的内容跟普通网页内容一样做直观标注定义采集规则。只是要注意一点:来自不同iframe的抓取内容要放在不同的整理箱中。在MS谋数台的创建规则工作台上可以创建多个整理箱,如果要从iframe中抓取内容,给每个iframe都创建一个整理箱

举报 使用道具
ykmbllw 初级会员 发表于 2020-6-29 09:51:02 | 显示全部楼层
内容分析应用 发表于 2020-6-28 17:06
采集iframe中的内容,这是GooSeeker网络爬虫的特色。iframe中的内容跟普通网页内容一样做直观标注定义采 ...

使用样例复制的时候  定位会被改变了
举报 使用道具
内容分析应用 中级会员 发表于 2020-6-29 14:42:17 | 显示全部楼层
ykmbllw 发表于 2020-6-29 09:51
使用样例复制的时候  定位会被改变了

你提供一个规则名称或者网址,技术看一下。
网址要能访问才行


举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 数据管家和集搜客网络爬虫超出配额是怎么回
  • 用GooSeeker数据管家能采集微博内容吗?
  • 怎样使用GooSeeker数据管家启动采集任务?
  • GooSeeker数据管家软件使用指导
  • 如何使用集搜客分词平台做社会网络图分析?

热门用户

GMT+8, 2020-7-16 22:39