目录
- 快捷采集
- 初级教程(新版)
- 初级教程(老版)
- 数据转Excel处理
- 爬虫规则管理
- 高级教程(新版)
- 高级教程(老版)
- 用爬虫群分布式高效采集
- 爬虫关键知识拓展
- 问题集锦
- 实战演练案例
- 爬虫安装说明
- 关于集搜客
集搜客交流群
2000人群:点击加入
“加载更多”如何设置抓取页面范围?
“加载更多”如何设置抓取页面范围?
采集微博博主主页,怎么选择采集范围?
博主主页工具里的这些采集范围有什么区别,要怎么选择? [attach]14306[/attach]
爬取的时候能不能设定爬取一定范围的内容?
爬取的时候能不能设定爬取一定范围的内容?因为只有范围是同一的,里面的每一项有多有少不好写规则。
GooSeeker能够选取范围进行页面截图吗?
比如我想截图页面的上半部分信息,下半部分的不要。这个可以做到吗?
怎么采集指定博主,指定时间范围,指定关键字且展开全文的所有微博?
新人求教,如题
怎么抓取微博中的大图,以及设置翻页页数
[i=s] 本帖最后由 mz1993 于 2019-1-2 00:07 编辑 [/i] [size=5]我想抓热门微博里的图片mz1993_preview/share412019.html 主要有2个问题,另外也请大家帮忙看看有没有其他问题 1.抓取下来的是下图那样一张张小的,怎么能抓成上图那样的大图 2.设置了翻页选项,但是想限定页数,怎么设置 谢谢大家[/size]
用嵌套整理箱限定采集范围
doc/article-330-1.html]样例复制规则采集商品列表[/url]的时候,会把所有商品都采集下来,为了限定范围通常需要建立一个嵌套的整理箱,就是说在整理箱这个大容器下再创建一层子容器,在最顶层容器节点上,通过定位标志映射,可以限定采集范围url=http://www.gooseeker.com/doc/thread-1365-1-1.html]样例复制如何进行范围搜索
采集范围限定的问题求帮助。
怎样设置可以让采集时完成采集需要的数据后不用往下加载网页而浪费采集时间?求帮助...谢谢! 规则名称:球探亚盘
样例复制如何进行范围搜索?
www.gooseeker.com/doc/thread-706-1-1.html]样例复制[/url] > 如何限定范围做样例复制[/size][/color]样例复制映射怎么能做到只在固定范围内部进行映射?
微博抓取
主体名:微博_动作_0918 我是跟着视频做的,但是无法抓取
设置时间段抓取
如下图所示,我要抓的这个网页我想设置时间段后,抓取搜索出来的结果,如果直接做规则的话,我只能抓到没有经过时间筛选的要实现时间段搜索结果的抓取要怎么做
求助,爬取微博签到数据,设置了滚屏但是只抓取了没有滚屏的内容
-6 21:39 编辑 [/i] [table=98%] [tr][td]如题 DS中关闭了自动滚屏 同时在工作台设置了滚屏每次滚屏数测试了一些 但是抓取的的数据只有没有滚屏的那几条 (一页全获取差不多40条只能获取没滚屏的15条左右) 如果每次滚屏数设置的小一些就会连续输出多个相同的文件 抓取的的数据依旧是没有滚屏的那几条 主题名:微博签到wb 页面地址:[url=https
微博热门榜ajax 加载更多要怎么设置
抓取的网址是:[url]http://d.weibo.com/102803?102803_ctg1_9999_-_ctg1_9999#Pl_Core_NewMixFeed__3[/url] 1)我先用翻页设置了,但是用记号线索/定点线索设置的翻页虽然可以加载出来后面的内容,但那一瞬间直接就抓取完毕了,不继续向下滚屏抓取。[attach]6540[/attach] 2)我第二个想用连续动作的“点击”方法来加载内容,然后继续抓取,但是点击后就状态栏又提示完成请问微博热门榜的这个加载更多要怎么处理才能抓取到全部内容? [attach]6541[/attach]
微博采集工具箱中的微博博主主页内容可以设置翻页页数吗
[attach]5862[/attach]我想抓好多个博主的主页内容,但只想抓取10页这样,能设置翻页次数吗
通过划定滚轮范围实现精确点击手机页面
虽然集搜客网络爬虫的早期版本已经引入了精确点击功能(参看高级教程中的《连续动作设置》),但是,对于手机页面,布局规划并没有考虑桌面浏览器