比如京东的,首先是第一级网页是商品列表,然后点击图片进去商品介绍页,这样的有两个层次的网页。
我想获取第一级页面列表里所有商品的具体介绍怎么做呢?

举报 使用道具
| 回复

共 3 个关于本帖的回复 最后回复于 2015-8-26 21:52

gooseeker_info 金牌会员 发表于 2015-8-25 18:50:02 | 显示全部楼层
这种不叫弹出网页,而是分级抓取,可以参看《集搜客中级——集搜客如何抓取多层级网页》,详细讲解怎样做多级抓取规则。

另外也可以到资源板块直接下载别人做好的抓取规则,直接点击运行即可
举报 使用道具
redwindy 中级会员 发表于 2015-8-26 21:45:49 | 显示全部楼层
gooseeker_info 发表于 2015-8-25 18:50
这种不叫弹出网页,而是分级抓取,可以参看《集搜客中级——集搜客如何抓取多层级网页》,详细讲解怎样做多 ...

哦……我去看了一下,大概明白意思了。就是一个主题下定义两个规则,一个规则对应一个网页,然后分别处理,是这个意思吧?
举报 使用道具
Fuller 管理员 发表于 2015-8-26 21:52:39 | 显示全部楼层
redwindy 发表于 2015-8-26 21:45
哦……我去看了一下,大概明白意思了。就是一个主题下定义两个规则,一个规则对应一个网页,然后分别处理 ...

两个规则,对应两级,第一个规则抓取商品列表时第一级,第二个规则抓取商品介绍,是第二级。两个规则定义好以后,可以在DS打数机上同时运行
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-19 06:02