比如京东的,首先是第一级网页是商品列表,然后点击图片进去商品介绍页,这样的有两个层次的网页。
我想获取第一级页面列表里所有商品的具体介绍怎么做呢?

举报 使用道具
| 回复

共 3 个关于本帖的回复 最后回复于 2015-8-26 21:52

沙发
gooseeker_info 金牌会员 发表于 2015-8-25 18:50:02 | 只看该作者
这种不叫弹出网页,而是分级抓取,可以参看《集搜客中级——集搜客如何抓取多层级网页》,详细讲解怎样做多级抓取规则。

另外也可以到资源板块直接下载别人做好的抓取规则,直接点击运行即可
举报 使用道具
板凳
redwindy 中级会员 发表于 2015-8-26 21:45:49 | 只看该作者
gooseeker_info 发表于 2015-8-25 18:50
这种不叫弹出网页,而是分级抓取,可以参看《集搜客中级——集搜客如何抓取多层级网页》,详细讲解怎样做多 ...

哦……我去看了一下,大概明白意思了。就是一个主题下定义两个规则,一个规则对应一个网页,然后分别处理,是这个意思吧?
举报 使用道具
地板
Fuller 管理员 发表于 2015-8-26 21:52:39 | 只看该作者
redwindy 发表于 2015-8-26 21:45
哦……我去看了一下,大概明白意思了。就是一个主题下定义两个规则,一个规则对应一个网页,然后分别处理 ...

两个规则,对应两级,第一个规则抓取商品列表时第一级,第二个规则抓取商品介绍,是第二级。两个规则定义好以后,可以在DS打数机上同时运行
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 运行Apple无法验证的程序的方法
  • 文本聚类分析软件的安装和使用方法
  • 利用AI阅读和分析文本:扣子COZE记录用户反
  • 在网页片段内直观标注——以B站评论采集为
  • 利用AI阅读和分析文本:使用COZE建设游记文

热门用户

GMT+8, 2024-12-22 13:02