本帖最后由 bsh331400 于 2018-4-16 16:22 编辑

网址:https://www.jianke.com/product/373512.html
我是想抓取如下图里的图片,现在下载本地的文件夹的图片只有两张是大图其他都是小图,请问要怎么实现大图和小图都下载下来

无标题.png
举报 使用道具
| 回复

共 21 个关于本帖的回复 最后回复于 2018-4-17 14:48

数据集 高级会员 发表于 2018-4-16 15:54:35 | 显示全部楼层
从网址上来看,采集图片做样例复制就可以了,可以把规则名发出来
举报 使用道具
bsh331400 中级会员 发表于 2018-4-16 15:57:12 | 显示全部楼层
数据集 发表于 2018-4-16 15:54
从网址上来看,采集图片做样例复制就可以了,可以把规则名发出来

规则名:健客网第三层2,请指教
举报 使用道具
bsh331400 中级会员 发表于 2018-4-16 16:17:38 | 显示全部楼层
数据集 发表于 2018-4-16 15:54
从网址上来看,采集图片做样例复制就可以了,可以把规则名发出来

样例复制只会出来小图片
举报 使用道具
wangyong 版主 发表于 2018-4-16 16:59:54 | 显示全部楼层
直接做样例复制抓取下来的图片链接是
的小图
大图的链接是
,可以把图片采集到Excel后将后缀替换了,再重新下载图片
也可以用xpathsubstringconcat函数将图片链接再采集时就拼好

举报 使用道具
bsh331400 中级会员 发表于 2018-4-16 17:15:41 | 显示全部楼层
wangyong 发表于 2018-4-16 16:59
直接做样例复制抓取下来的图片链接是
的小图
大图的链接是

能够详细点不,针对哪个节点去substring,首先大概思路:内容映射应该是映射一个范围对吧,然后去拼接下Xpath对吗

举报 使用道具
wangyong 版主 发表于 2018-4-16 17:29:42 | 显示全部楼层
不需要什么范围,就是要写自定义的xpath
举报 使用道具
wangyong 版主 发表于 2018-4-16 17:32:08 | 显示全部楼层
这个是xpath的教程,先了解基本的语法再去写函数
举报 使用道具
wangyong 版主 发表于 2018-4-16 17:48:58 | 显示全部楼层
举报 使用道具
bsh331400 中级会员 发表于 2018-4-16 17:50:32 | 显示全部楼层
wangyong 发表于 2018-4-16 17:32
这个是xpath的教程,先了解基本的语法再去写函数

函数我会用的,就是这个关于这个用想xpath采集的思路还不会,是第一步还是映射小图的@src节点,然后高级设置去编写xpath,哪个节点去拼接和subtring_before
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-3-29 01:58