比如京东的,首先是第一级网页是商品列表,然后点击图片进去商品介绍页,这样的有两个层次的网页。
我想获取第一级页面列表里所有商品的具体介绍怎么做呢?

举报 使用道具
| 回复

共 3 个关于本帖的回复 最后回复于 2015-8-26 21:52

沙发
gooseeker_info 金牌会员 发表于 2015-8-25 18:50:02 | 只看该作者
这种不叫弹出网页,而是分级抓取,可以参看《集搜客中级——集搜客如何抓取多层级网页》,详细讲解怎样做多级抓取规则。

另外也可以到资源板块直接下载别人做好的抓取规则,直接点击运行即可
举报 使用道具
板凳
redwindy 中级会员 发表于 2015-8-26 21:45:49 | 只看该作者
gooseeker_info 发表于 2015-8-25 18:50
这种不叫弹出网页,而是分级抓取,可以参看《集搜客中级——集搜客如何抓取多层级网页》,详细讲解怎样做多 ...

哦……我去看了一下,大概明白意思了。就是一个主题下定义两个规则,一个规则对应一个网页,然后分别处理,是这个意思吧?
举报 使用道具
地板
Fuller 管理员 发表于 2015-8-26 21:52:39 | 只看该作者
redwindy 发表于 2015-8-26 21:45
哦……我去看了一下,大概明白意思了。就是一个主题下定义两个规则,一个规则对应一个网页,然后分别处理 ...

两个规则,对应两级,第一个规则抓取商品列表时第一级,第二个规则抓取商品介绍,是第二级。两个规则定义好以后,可以在DS打数机上同时运行
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 利用AI阅读和分析文本:使用COZE建设游记文
  • 使用AI工具Kimi生成python代码为文本分析结
  • 苹果mac电脑安装集搜客网络爬虫软件失败的
  • 下载支持win7的集搜客网络爬虫软件
  • 遇到“无法识别的应用”告警怎么办?

热门用户

GMT+8, 2024-9-17 03:08