根据一个检索结果字段比较全的页面定义了任务inis2024,但是journal字段还是无法在这里显示.通过其他检索方式能够检索到带journal的结果集合。我把检索到journal的集合里的xpath复制到我的任务里journal字段的吗?然后这样抓取的每一页的所有记录journal字段内容都是一样的了。,,

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
| 回复

共 4 个关于本帖的回复 最后回复于 2023-11-23 10:25

沙发
wangyong 版主 发表于 2023-11-22 15:42:27 | 只看该作者
  1. .//*[@class='col-md-10 cc journal]
复制代码

你把xpath改成这样就可以了,加上“.”代表采集每条的标题,不加“.”采集的就是第一篇的标题
举报 使用道具
板凳
xzhang 高级会员 发表于 2023-11-22 19:22:43 | 只看该作者
我加上 . 后什么也采集不下来了。内容是空了
举报 使用道具
地板
xzhang 高级会员 发表于 2023-11-22 19:34:42 | 只看该作者
wangyong 发表于 2023-11-22 15:42
你把xpath改成这样就可以了,加上“.”代表采集每条的标题,不加“.”采集的就是第一篇的标题 ...

我加上.后什么也采集不下来了,是空的
举报 使用道具
5#
Fuller 管理员 发表于 2023-11-23 10:25:20 | 只看该作者
xzhang 发表于 2023-11-22 19:34
我加上.后什么也采集不下来了,是空的

这个网址我们访问不了,没法帮你加载规则做测试
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 利用AI阅读和分析文本:扣子COZE记录用户反
  • 在网页片段内直观标注——以B站评论采集为
  • 利用AI阅读和分析文本:使用COZE建设游记文
  • 使用AI工具Kimi生成python代码为文本分析结
  • 苹果mac电脑安装集搜客网络爬虫软件失败的

热门用户

GMT+8, 2024-12-4 01:26