目录
- 快捷采集
- 初级教程(新版)
- 初级教程(老版)
- 数据转Excel处理
- 爬虫规则管理
- 高级教程(新版)
- 高级教程(老版)
- 用爬虫群分布式高效采集
- 爬虫关键知识拓展
- 问题集锦
- 实战演练案例
- 爬虫安装说明
- 关于集搜客
集搜客交流群
2000人群:点击加入
瀑布流网页抓取问题
瀑布流网页抓取问题 任务名称 : hyperion目录 瀑布自动走可以,但不知道是否是正常走到底部了.
点击更多的瀑布流网页
采集一个瀑布流网页,网页最底下有个“加载更多”的按钮,点击一下才会加载更多内容,请问这种要怎么采集啊
瀑布流式网页抓取中断
用滚屏动作抓取瀑布流式网页时,滚屏次数设置的是0,滚屏速度设置的是1,并且在连续动作的设置中总共滚屏数设置的是-1,结束标志是重复内容样本网址是:[url]https://www.indiegogo.com/search#/?q=no%20time%20left&ended[/url] 规则名是:indiegogo网址
瀑布流网页无法自动滚屏
在抓取瀑布流网页时,参照了今日头条那个连续动作案例选择了滚屏的连续动作,但是在抓取过程中如果不动页面就只能抓10条数据重复抓三次,在抓取过程中滚动页面就能多抓数据,一直抓到我滑动到的网页那块,但因为我滑动网页加载的速度没抓取数据速度快,所以前面的数据会重复抓取多次抓取的网页链接是抑郁症 - 好大夫在线 (haodf.com)
请教:瀑布流网页抓取失败
网页属于滚动鼠标,自动翻页加载的网页,到最后一页才会停止,学习瀑布流教程,设置规则总是失败,求大神指教!!!!规则:养老院全国 网址:https://www.yanglaocn.com/yanglaoyuan/yly/?
瀑布流网页清除老数据失败
使用滚屏连续动作爬取今日头条数据时,设置了清除老数据,但采集的时候还是有很多个excel表格,跟没设置清除老数据一样,这是咋回事啊?可以帮我看看吗? 规则名词:suibe_ydh_今日头条
怎样采集瀑布流网页的详情页面?
我要采集的页面是瀑布流 [url]https://m.baidu.com/s?%8B%23&topic_id=161459391213296918&sa=hts_kg_hot[/url] 瀑布流自动滚屏在列表页,没有详情页的链接,我看了一下教程,需要用回退动作。 怎么把自动滚屏和回退动作结合起来?
求教复杂的瀑布流网页信息采集
这是打开网址后的初始页面 [attach]3297[/attach] 我希望采集列表的全部信息,可是电话信息被遮挡住了这是点击后弹出来的网页。这个点击没有任何链接需要设置模拟动作 [attach]3300[/attach] 而且这个网址点击后网页结构发生变化了跪求大神请教这个网址怎么采集电话信息呢?谢谢了。 附上网址(各位点击下发货,然后手机收下验证码就可以了)。
瀑布流数据重复
你好,我在wish这个网站进行产品评论采集时,第一级网页是瀑布流的形式,每次滚屏采集到的XML文件内容前半部分产品链接都是重复的
瀑布流抓取中断
][/color] [color=rgb(51, 51, 51)][size=15px][b] 瀑布流抓取几百条数据就中断还有一个问题就是网页滚动的非常慢,我设置过滚动速度也没用!
瀑布流加载不出
采集一个瀑布流的网站,规则运行起来,但是网页下面的内容加载不出来采集不到怎么办?
应用场景描述:连续滚屏抓取瀑布流网页
场景描述 很早以前的版本就有了自动滚屏功能,GooSeeker V5.4.0新增的连续滚屏是用于很长很长的瀑布流网页抓取的如果一个网页不是很长,滚几次就能到底,比如,京东和淘宝上的商品详情有很多图片,需要滚好几屏才 ...
瀑布流网页滚轮抓取无法清除第一条老数据
瀑布流网页滚轮抓取无法清除第一条老数据 任务名是: 小红书评论获取
瀑布流网页滚轮抓取无法清除第一条老数据
[size=16px]瀑布流网页滚轮抓取无法清除第一条老数据[/size] [size=16px]任务名是: 小红书评论获取
点击 才能查看更多的瀑布流网页怎么采集数据
点一下才出现一点的那种