请问对于这类文本后面带数字,比如口碑(62),每个网页的数字都不一样,如何作模拟点击翻页呢?

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
| 回复

共 8 个关于本帖的回复 最后回复于 2018-11-23 18:54

沙发
Fuller 管理员 发表于 2018-11-23 15:59:13 | 只看该作者
点击定位的xpath不会定位到text节点的,定位到text节点还会出错,要定位到包含这个text的A节点,对于A节点来说,他是不管里面有什么内容的。

如果你确实想用里面的文字作为定位的标志,那么就用contains()函数,只检查“口碑”这个词
举报 使用道具
板凳
kaka_22 初级会员 发表于 2018-11-23 16:15:57 | 只看该作者
Fuller 发表于 2018-11-23 15:59
点击定位的xpath不会定位到text节点的,定位到text节点还会出错,要定位到包含这个text的A节点,对于A节点 ...

是这样使用吗

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
地板
Fuller 管理员 发表于 2018-11-23 16:20:13 | 只看该作者

不能这样放,函数不能放在标志这里。要这样:1,做正常的翻页记号映射
2,不要勾选“全匹配”
3,删除(数字)部分
自动生成的规则会自动使用contains函数
举报 使用道具
5#
kaka_22 初级会员 发表于 2018-11-23 16:44:56 | 只看该作者
Fuller 发表于 2018-11-23 16:20
不能这样放,函数不能放在标志这里。要这样:1,做正常的翻页记号映射
2,不要勾选“全匹配”
3,删除(数 ...

我的一级主题是采集了400个网址给第二主题,第二主题一进来是“数据”这一栏,我做了个模拟点击切换到“口碑”,然后是第三主题做爬取,但是400个网址只有第一个网址爬取数据了。。。。。。请问可能是什么原因导致的呢
举报 使用道具
6#
kaka_22 初级会员 发表于 2018-11-23 16:49:39 | 只看该作者
Fuller 发表于 2018-11-23 16:20
不能这样放,函数不能放在标志这里。要这样:1,做正常的翻页记号映射
2,不要勾选“全匹配”
3,删除(数 ...

是不是因为在第二主题没有做样例复制?
举报 使用道具
7#
Fuller 管理员 发表于 2018-11-23 17:46:36 | 只看该作者
kaka_22 发表于 2018-11-23 16:49
是不是因为在第二主题没有做样例复制?

把所有主题名发出来,可以给你诊断一下
举报 使用道具
8#
kaka_22 初级会员 发表于 2018-11-23 17:48:42 | 只看该作者
Fuller 发表于 2018-11-23 17:46
把所有主题名发出来,可以给你诊断一下

好了   在整理箱那边选了绝对定位就可以
举报 使用道具
9#
Fuller 管理员 发表于 2018-11-23 18:54:12 | 只看该作者
kaka_22 发表于 2018-11-23 17:48
好了   在整理箱那边选了绝对定位就可以

那是因为每一条可能都有一个特别的id代表他们,如果用绝对定位就不会使用这个id,绝对定位可能会影响规则的适应性,可以考虑选择只用class,或者想办法避开这个唯一性id,用定位标志映射就能自主选择使用哪个定位标志
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 为什么用微软的excel无法打开xls文件?powe
  • 360或火绒等杀毒软件导致GooSeeker爬虫软件
  • 话题分析(NMF模型和LDA模型)软件的安装和
  • 运行Apple无法验证的程序的方法
  • 文本聚类分析软件的安装和使用方法

热门用户

GMT+8, 2025-7-12 22:53