快捷导航
【mobile.yangkeduo.com/search_result.html?search_key=布鞋女】      这个网页   单个宝贝里面没有ID   id="__NEXT_PAGE__/search_result" src="https://cdn.yangkeduo.com/_next/72e11789-19f9-4e18-9c0b-8a3ae522adb6/page/search_result.js">   

点击宝贝以后  产生 ID
【mobile.yangkeduo.com/goods.html?goods_id=1334949192】




要怎么样才能采集到ID
举报 使用道具
| 回复

共 2 个关于本帖的回复 最后回复于 2018-9-12 09:40

Fuller 管理员 发表于 2018-8-27 18:16:12 | 显示全部楼层
这个需要定义连续点击动作,在教程的高级教程里面有连续点击。这样就形成两级主题:
1,主题A:加载商品列表页,在这个规则中定义点击动作,逐个点击商品。目标主题是B
2,主题B:显示详情页,抓取需要的内容,也能把网址记录在结果文件中的realpath字段中,其中就有商品ID。这个规则还要做一个回退动作,目标主题是A

教程首页:https://www.gooseeker.com/tuto/tutorial.html
左栏是教程目录,点击开就能看到高级教程
举报 使用道具
zhongqucaiji 高级会员 发表于 2018-9-12 09:40:12 | 显示全部楼层
Fuller 发表于 2018-8-27 18:16
这个需要定义连续点击动作,在教程的高级教程里面有连续点击。这样就形成两级主题:
1,主题A:加载商品列 ...

该页面没有回退节点  可以点击

举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 大型百货商场会员画像描绘
  • 自动导入导出数据
  • 批量爬取蘑菇街商品价格、评论信息
  • 微博用户数据分析
  • 批量爬取苏宁商品价格、评论信息

热门用户

集搜客GooSeeker网络爬虫 ( 粤ICP备11065265号-2 )

GMT+8, 2018-11-15 12:09