11#
wangyong 版主 发表于 2021-6-24 16:18:49 | 只看该作者
chenjf 发表于 2021-6-24 15:07
附件有显示规则名


做样例复制时选择第一个tr和第二个tr分别做样例复制映射

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
12#
chenjf 初级会员 发表于 2021-6-24 16:28:03 | 只看该作者
做了。一个是样例1,一个是样例2.  一样问题,采不到,你试一下?
举报 使用道具
13#
Fuller 管理员 发表于 2021-6-24 17:53:42 | 只看该作者
chenjf 发表于 2021-6-24 16:28
做了。一个是样例1,一个是样例2.  一样问题,采不到,你试一下?

这个网页有些麻烦,主要是有些tr会多一个td,就是在编号字段后面多一个。

要逐个写自定义xpath,我还在实验,怎样写自定义xpath比较好
举报 使用道具
14#
chenjf 初级会员 发表于 2021-6-25 08:49:03 | 只看该作者
是的。我发现它是不是故意 的。20行TR,有的9个TD,有的8个TD。谢谢你
举报 使用道具
15#
chenjf 初级会员 发表于 2021-6-28 09:36:48 | 只看该作者
辛苦辛苦
举报 使用道具
16#
Fuller 管理员 发表于 2021-6-28 10:25:46 | 只看该作者

全部使用自定义xpath,目前好在第一个要抓取的内容是一个A节点,另外,后面其他抓取内容相对于这个A节点的位置不变,那么就要首先写好第一个抓取内容的XPath,其他的相对于这个节点写。



第一个抓取内容的xpath是:td[position()=3 or position()=4]/a/text()
第二个的是:td[count(preceding-sibling::td[1]/a)>0]/text()
preceding-sibling::td[1]中的1就是相对位置,第三个的依次修改这个数字

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 话题分析(NMF模型和LDA模型)软件的安装和
  • 运行Apple无法验证的程序的方法
  • 文本聚类分析软件的安装和使用方法
  • 利用AI阅读和分析文本:扣子COZE记录用户反
  • 在网页片段内直观标注——以B站评论采集为

热门用户

GMT+8, 2025-2-6 17:34