规则名称“电视剧宣发微博物料采集”爬取网址:https://weibo.com/p/1002066150454520/photos?from=page_100206&mod=TAB#place

规则很简单,测试窗口可以直接拉到最后一张图。
刚开始只能爬取一小半,后来发现可能是滚动刷新速度问题,将调整滚屏参数调整为2/-1。
爬取数量增多,但还是爬取到3/4时就会显示【总线索:1 Loops】然后闪几下就显示采集完成。
举报 使用道具
| 回复

共 2 个关于本帖的回复 最后回复于 2020-5-9 15:06

沙发
wangyong 版主 发表于 2020-5-9 14:52:39 | 只看该作者
滚屏参数还是小了,需要改成20/-2,超时时长改成120秒
举报 使用道具
板凳
Fuller 管理员 发表于 2020-5-9 15:06:52 | 只看该作者
1和-1是一样的,没有变速,2,3,4,5...越来越快,-2,-3,-4,..... 越来越慢
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 利用AI阅读和分析文本:扣子COZE记录用户反
  • 在网页片段内直观标注——以B站评论采集为
  • 利用AI阅读和分析文本:使用COZE建设游记文
  • 使用AI工具Kimi生成python代码为文本分析结
  • 苹果mac电脑安装集搜客网络爬虫软件失败的

热门用户

GMT+8, 2024-11-23 15:56