快捷导航
【mobile.yangkeduo.com/search_result.html?search_key=布鞋女】      这个网页   单个宝贝里面没有ID   id="__NEXT_PAGE__/search_result" src="https://cdn.yangkeduo.com/_next/72e11789-19f9-4e18-9c0b-8a3ae522adb6/page/search_result.js">   

点击宝贝以后  产生 ID
【mobile.yangkeduo.com/goods.html?goods_id=1334949192】




要怎么样才能采集到ID
举报 使用道具
| 回复

共 2 个关于本帖的回复 最后回复于 2018-9-12 09:40

Fuller 管理员 发表于 2018-8-27 18:16:12 | 显示全部楼层
这个需要定义连续点击动作,在教程的高级教程里面有连续点击。这样就形成两级主题:
1,主题A:加载商品列表页,在这个规则中定义点击动作,逐个点击商品。目标主题是B
2,主题B:显示详情页,抓取需要的内容,也能把网址记录在结果文件中的realpath字段中,其中就有商品ID。这个规则还要做一个回退动作,目标主题是A

教程首页:https://www.gooseeker.com/tuto/tutorial.html
左栏是教程目录,点击开就能看到高级教程
举报 使用道具
zhongqucaiji 高级会员 发表于 2018-9-12 09:40:12 | 显示全部楼层
Fuller 发表于 2018-8-27 18:16
这个需要定义连续点击动作,在教程的高级教程里面有连续点击。这样就形成两级主题:
1,主题A:加载商品列 ...

该页面没有回退节点  可以点击

举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 怎样用爬虫爬取亚马逊商品评论?
  • 新版集搜客网络爬虫图片下载功能
  • windows高清屏幕显示模糊的解决方法
  • 修改和找回密码——微信登录集搜客GooSeeke
  • 网络爬虫自动打验证码避免重复打码

热门用户

集搜客GooSeeker网络爬虫 ( 粤ICP备11065265号-2 )

GMT+8, 2019-1-18 19:38