集搜客GooSeeker网络爬虫

标题: 图片无法下载 [打印本页]

作者: derick0826    时间: 2020-5-8 10:43
标题: 图片无法下载
任务名:qp_picture20200508
无法下载图片

作者: Fuller    时间: 2020-5-8 11:05
[attach]12395[/attach]

这个抓取内容是没有意义的,要下图的话,应该用图片的src 做内容映射,像“图片链接”那样

作者: Fuller    时间: 2020-5-8 11:07
[attach]12396[/attach]

如果你想下载某个区域内的所有图片,像上图,你应该用A节点做内容映射。不要用IMG节点做内容映射

作者: derick0826    时间: 2020-5-8 11:44
Fuller 发表于 2020-5-8 11:07
如果你想下载某个区域内的所有图片,像上图,你应该用A节点做内容映射。不要用IMG节点做内容映射
...

我的应该怎么设置呢

作者: derick0826    时间: 2020-5-8 12:26
Fuller 发表于 2020-5-8 11:07
如果你想下载某个区域内的所有图片,像上图,你应该用A节点做内容映射。不要用IMG节点做内容映射
...

[attach]12398[/attach]
是这样设的吗,好像还不行啊

作者: Fuller    时间: 2020-5-8 15:13
derick0826 发表于 2020-5-8 12:26
是这样设的吗,好像还不行啊

这里的高级设置,做规则的时候没有限制,这是爬虫软件应该改进的地方,目前要自己设置对:“文本内容”下载不到图片,因为采集下来文本内容,里面就没有图片网址了。所以,要勾“网页片段”。

[attach]12399[/attach]

作者: Fuller    时间: 2020-5-8 15:17
刚才我测试了一下,如果你还想采集到A节点下的文本内容,同时又下载图片,勾上“纯文本内容”。目前看,就是“文本内容"这个选项不合适




欢迎光临 集搜客GooSeeker网络爬虫 (http://www.gooseeker.com/doc/) Powered by Discuz! X3.2