根据一个检索结果字段比较全的页面定义了任务inis2024,但是journal字段还是无法在这里显示.通过其他检索方式能够检索到带journal的结果集合。我把检索到journal的集合里的xpath复制到我的任务里journal字段的吗?然后这样抓取的每一页的所有记录journal字段内容都是一样的了。 L`YMN2UHLFCL_{@F%_KILAR.jpg $PTU~E91G[@XBY7)@HDI$MW.jpg V]NQ_$O8E~Q`RBXYBH`XBD1.jpg
举报 使用道具
| 回复

共 4 个关于本帖的回复 最后回复于 2023-11-23 10:25

wangyong 版主 发表于 2023-11-22 15:42:27 | 显示全部楼层
  1. .//*[@class='col-md-10 cc journal]
复制代码

你把xpath改成这样就可以了,加上“.”代表采集每条的标题,不加“.”采集的就是第一篇的标题
举报 使用道具
xzhang 高级会员 发表于 2023-11-22 19:22:43 | 显示全部楼层
我加上 . 后什么也采集不下来了。内容是空了
举报 使用道具
xzhang 高级会员 发表于 2023-11-22 19:34:42 | 显示全部楼层
wangyong 发表于 2023-11-22 15:42
你把xpath改成这样就可以了,加上“.”代表采集每条的标题,不加“.”采集的就是第一篇的标题 ...

我加上.后什么也采集不下来了,是空的
举报 使用道具
Fuller 管理员 发表于 2023-11-23 10:25:20 | 显示全部楼层
xzhang 发表于 2023-11-22 19:34
我加上.后什么也采集不下来了,是空的

这个网址我们访问不了,没法帮你加载规则做测试
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-29 23:47