15 16297

不能有规则的取到列表数据

chenjf 于 2021-6-24 11:40 发表 [复制链接]
wangyong 版主 发表于 2021-6-24 16:18:49 | 显示全部楼层
chenjf 发表于 2021-6-24 15:07
附件有显示规则名

QQ截图20210624160804.png
做样例复制时选择第一个tr和第二个tr分别做样例复制映射
举报 使用道具
chenjf 初级会员 发表于 2021-6-24 16:28:03 | 显示全部楼层
做了。一个是样例1,一个是样例2.  一样问题,采不到,你试一下?
举报 使用道具
Fuller 管理员 发表于 2021-6-24 17:53:42 | 显示全部楼层
chenjf 发表于 2021-6-24 16:28
做了。一个是样例1,一个是样例2.  一样问题,采不到,你试一下?

这个网页有些麻烦,主要是有些tr会多一个td,就是在编号字段后面多一个。

要逐个写自定义xpath,我还在实验,怎样写自定义xpath比较好
举报 使用道具
chenjf 初级会员 发表于 2021-6-25 08:49:03 | 显示全部楼层
是的。我发现它是不是故意 的。20行TR,有的9个TD,有的8个TD。谢谢你
举报 使用道具
chenjf 初级会员 发表于 2021-6-28 09:36:48 | 显示全部楼层
辛苦辛苦
举报 使用道具
Fuller 管理员 发表于 2021-6-28 10:25:46 | 显示全部楼层

全部使用自定义xpath,目前好在第一个要抓取的内容是一个A节点,另外,后面其他抓取内容相对于这个A节点的位置不变,那么就要首先写好第一个抓取内容的XPath,其他的相对于这个节点写。

第一个.png

第一个抓取内容的xpath是:td[position()=3 or position()=4]/a/text()
第二个的是:td[count(preceding-sibling::td[1]/a)>0]/text()
preceding-sibling::td[1]中的1就是相对位置,第三个的依次修改这个数字
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-19 08:33