如图:
我只想要采集图片跟pin数 但是,在第一级中,没有看到img这个点,是需要点击出来才可以采集得到吗?
样本:https://www.pinterest.com/search/pins/?q=denim&rs=typed&term_meta[]=denim%7Ctyped

如果需要点击才可以,那这里应当是使用模拟点击?
在同一个规则下?点击爬虫路线进行设置吗?
举报 使用道具
| 回复

共 4 个关于本帖的回复 最后回复于 2016-10-22 16:36

沙发
beanbing 中级会员 发表于 2016-10-22 15:50:07 | 只看该作者
谁能解答一下呢  
举报 使用道具
板凳
xandy 论坛元老 发表于 2016-10-22 15:56:41 | 只看该作者
看了下这个网站,我主要讲一下采集图片的思路:
建立两个规则——
第一个规则抓每个图片的详细页面(因为第一个页面没有不能抓到原图的IMG),将@href映射给“图片详细”,给图片详细做下级线索,做样例复制......
下级线索的规则就是第二个要建立的规则

第二个规则针对点击该图片跳转后的页面来做,上图的图片点击后会跳转到https://www.pinterest.com/pin/102034747787456724/这个页面,将该图片的@src映射给“图片”,勾选“图片下载”就可以了

举报 使用道具
地板
beanbing 中级会员 发表于 2016-10-22 16:25:17 | 只看该作者
规则弄好了   在爬数据的时候第一级滚屏设置了 0,-2,第二级网页要输入1吗?  出来就只有一张图片
举报 使用道具
5#
xandy 论坛元老 发表于 2016-10-22 16:36:08 | 只看该作者
beanbing 发表于 2016-10-22 16:25
规则弄好了   在爬数据的时候第一级滚屏设置了 0,-2,第二级网页要输入1吗?  出来就只有一张图片 ...

注意第一级规则要给“图片详细”(@href)做样例复制,不然没法为第二级规则生成批量线索
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-27 11:00