请问为什么谋数台显示出的xpath比之前多了<context>//*[@id='m']</context>
xpath直接写//*[@id='productMainName']突然定位不到位置了


举报 使用道具
| 回复

共 7 个关于本帖的回复 最后回复于 2020-6-29 14:42

沙发
Fuller 管理员 发表于 2016-10-2 15:03:38 | 只看该作者
<context>表示这个dom节点位于iframe中,iframe还可以嵌套,表示多层iframe
举报 使用道具
板凳
liang616611974 新手上路 发表于 2018-11-8 18:38:27 | 只看该作者
哪有什么解决方案吗
举报 使用道具
地板
Fuller 管理员 发表于 2018-11-8 19:14:26 | 只看该作者
liang616611974 发表于 2018-11-8 18:38
哪有什么解决方案吗

你遇到的问题是发生在什么时候?

集搜客爬虫把XPath扩展了了一下,增加了<context>,每个<context>代表一个iframe,这个xpath的应用场景是有限制的。可以用在爬虫路线那里,也可以用在连续动作那里。但是不能用在数据规则那里,因为数据规则那里一定是在某个iframe内的,不会跨iframe,所以就用不上<context>
举报 使用道具
5#
ykmbllw 初级会员 发表于 2020-6-28 16:11:26 | 只看该作者
Fuller 发表于 2018-11-8 19:14
你遇到的问题是发生在什么时候?

集搜客爬虫把XPath扩展了了一下,增加了,每个代表一个iframe,这个xpa ...

CLASS定位中带了   <context>    怎么把这个数据提取出来     或者怎么写XPANTH  才正确
举报 使用道具
6#
内容分析应用 金牌会员 发表于 2020-6-28 17:06:16 | 只看该作者
ykmbllw 发表于 2020-6-28 16:11
CLASS定位中带了       怎么把这个数据提取出来     或者怎么写XPANTH  才正确
...

采集iframe中的内容,这是GooSeeker网络爬虫的特色。iframe中的内容跟普通网页内容一样做直观标注定义采集规则。只是要注意一点:来自不同iframe的抓取内容要放在不同的整理箱中。在MS谋数台的创建规则工作台上可以创建多个整理箱,如果要从iframe中抓取内容,给每个iframe都创建一个整理箱

举报 使用道具
7#
ykmbllw 初级会员 发表于 2020-6-29 09:51:02 | 只看该作者
内容分析应用 发表于 2020-6-28 17:06
采集iframe中的内容,这是GooSeeker网络爬虫的特色。iframe中的内容跟普通网页内容一样做直观标注定义采 ...

使用样例复制的时候  定位会被改变了
举报 使用道具
8#
内容分析应用 金牌会员 发表于 2020-6-29 14:42:17 | 只看该作者
ykmbllw 发表于 2020-6-29 09:51
使用样例复制的时候  定位会被改变了

你提供一个规则名称或者网址,技术看一下。
网址要能访问才行


举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 360或火绒等杀毒软件导致GooSeeker爬虫软件
  • 话题分析(NMF模型和LDA模型)软件的安装和
  • 运行Apple无法验证的程序的方法
  • 文本聚类分析软件的安装和使用方法
  • 利用AI阅读和分析文本:扣子COZE记录用户反

热门用户

GMT+8, 2025-4-22 06:11