规则名称“电视剧宣发微博物料采集”爬取网址:https://weibo.com/p/1002066150454520/photos?from=page_100206&mod=TAB#place

规则很简单,测试窗口可以直接拉到最后一张图。
刚开始只能爬取一小半,后来发现可能是滚动刷新速度问题,将调整滚屏参数调整为2/-1。
爬取数量增多,但还是爬取到3/4时就会显示【总线索:1 Loops】然后闪几下就显示采集完成。
举报 使用道具
| 回复

共 2 个关于本帖的回复 最后回复于 2020-5-9 15:06

沙发
shenzhenuser1 版主 发表于 2020-5-9 14:52:39 | 只看该作者
滚屏参数还是小了,需要改成20/-2,超时时长改成120秒
举报 使用道具
板凳
Fuller 管理员 发表于 2020-5-9 15:06:52 | 只看该作者
1和-1是一样的,没有变速,2,3,4,5...越来越快,-2,-3,-4,..... 越来越慢
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 怎样让GooSeeker分词工具使用宋体画词云图
  • 使用BERTopic时遇到的c-TF-IDF是什么?
  • gooseeker分词工具的命名实体识别和词形还
  • 怎样设置LDA模型的超参数alpha(α)和beta(
  • LDA主题分析模型到底是什么?

热门用户

GMT+8, 2026-5-16 04:14