【mobile.yangkeduo.com/search_result.html?search_key=布鞋女】      这个网页   单个宝贝里面没有ID   id="__NEXT_PAGE__/search_result" src="https://cdn.yangkeduo.com/_next/72e11789-19f9-4e18-9c0b-8a3ae522adb6/page/search_result.js">   

点击宝贝以后  产生 ID
【mobile.yangkeduo.com/goods.html?goods_id=1334949192】




要怎么样才能采集到ID
举报 使用道具
| 回复

共 2 个关于本帖的回复 最后回复于 2018-9-12 09:40

沙发
Fuller 管理员 发表于 2018-8-27 18:16:12 | 只看该作者
这个需要定义连续点击动作,在教程的高级教程里面有连续点击。这样就形成两级主题:
1,主题A:加载商品列表页,在这个规则中定义点击动作,逐个点击商品。目标主题是B
2,主题B:显示详情页,抓取需要的内容,也能把网址记录在结果文件中的realpath字段中,其中就有商品ID。这个规则还要做一个回退动作,目标主题是A

教程首页:https://www.gooseeker.com/tuto/tutorial.html
左栏是教程目录,点击开就能看到高级教程
举报 使用道具
板凳
zhongqucaiji 高级会员 发表于 2018-9-12 09:40:12 | 只看该作者
Fuller 发表于 2018-8-27 18:16
这个需要定义连续点击动作,在教程的高级教程里面有连续点击。这样就形成两级主题:
1,主题A:加载商品列 ...

该页面没有回退节点  可以点击

举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-25 13:46