主题名:ecco海外
问题:抓取宝贝图片,测试是全部能抓的,但用打数机只能抓前面几个,后面的图片链接都会变成 “ //assets.alicdn.com/g/s.gif ”
延迟抓取设为5秒,滚屏速度设置为-10还是无法解决?
ps:之前抓淘宝内页的时候,宝贝图片也是要独立一个整理箱才能抓,请问这是什么原因?



举报 使用道具
| 回复

共 3 个关于本帖的回复 最后回复于 2017-1-20 15:00

沙发
xandy 论坛元老 发表于 2017-1-20 14:15:25 | 只看该作者
本帖最后由 xandy 于 2017-1-20 14:31 编辑

滚屏要开(比如滚屏次数为2),超长延时可以调整一下,滚屏速度调为1就行了,调成-10的话会影响抓取
举报 使用道具
板凳
756292075 中级会员 发表于 2017-1-20 14:55:39 | 只看该作者
打数机默认不加载图片 勾选加载图片后才能抓取图片链接
请问一下,为什么我其他规则不加载图片也能抓取图片链接,这个却要加载图片,不然会抓到一个空的gif图?
加载图片和抓取图片链接有什么关系吗?
举报 使用道具
地板
xandy 论坛元老 发表于 2017-1-20 15:00:56 | 只看该作者
756292075 发表于 2017-1-20 14:55
打数机默认不加载图片 勾选加载图片后才能抓取图片链接
请问一下,为什么我其他规则不加载图片也能抓取图片 ...

有些网页的图片是跟着页面加载的过程中上载的,所以你不勾选加载图片的话,就可能采到空的图片
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-3 20:11