快捷导航
翻滚动作高级设置xpath清除老内容怎么设置?

高级设置如何定位

高级设置如何定位
举报 使用道具
| 回复

共 4 个关于本帖的回复 最后回复于 2021-1-18 16:58

Fuller 管理员 发表于 2021-1-18 15:17:49 | 显示全部楼层
举个列子,采集规则要采集UL元素下的所有LI内容,那么xpath可能是 xxx/xxx/li,这个xpath能定位到所有LI元素。那么用这个xpath填到清除老数据这里,爬虫运行的时候,在每一轮采集前,就会把LI元素删掉只剩下第一个和最后一个,一滚屏,就有新数据接到最后一个LI往后排。

这个功能只有旗舰版才能用
举报 使用道具
halo1997 初级会员 发表于 2021-1-18 16:33:01 | 显示全部楼层
谢谢,我来看看
举报 使用道具
halo1997 初级会员 发表于 2021-1-18 16:35:01 | 显示全部楼层
可以举一个详细的例子吗,新手小白有点看不懂,有旗舰版会员,谢谢
举报 使用道具
Fuller 管理员 发表于 2021-1-18 16:58:45 | 显示全部楼层
halo1997 发表于 2021-1-18 16:35
可以举一个详细的例子吗,新手小白有点看不懂,有旗舰版会员,谢谢

这里有一个教程: https://www.gooseeker.com/doc/article-406-1.html
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 用Jupyter Notebook的模板管理数据分析过程
  • Jupyter Notebook在机器学习领域的项目目录
  • 统计学中的二项分布、负二项分布、几何分布
  • 连续动作:自动搜索关键词采集信息—以人民
  • 利用重加载防止采集微博博主消息列表中断

热门用户

GMT+8, 2021-2-26 15:46