目录
- 快捷采集
- 初级教程(新版)
- 初级教程(老版)
- 数据转Excel处理
- 爬虫规则管理
- 高级教程(新版)
- 高级教程(老版)
- 用爬虫群分布式高效采集
- 爬虫关键知识拓展
- 问题集锦
- 实战演练案例
- 爬虫安装说明
- 关于集搜客
集搜客交流群
2000人群:点击加入
第80期在线培训_电商数据一键采集
[media=x,1000,750]http://v.youku.com/v_show/id_XMzEyODEyNzM1Mg==.html[/media] [url=https://pan.baidu.com/s/1eSB2oHO]不想看广告?直接下视频[/url]
【第31期】图片采集
下面以采集微博图片为例,给大家讲解一下如何实现采集数据并下载图片。点击观看培训视频 若有疑问可以或 ... ...
第57期在线培训_电商数据一键采集培训
://www.gooseeker.com/doc/thread-2486-1-1.html]初级视频[/url]-> 第57期在线培训_电商数据一键采集培训 [/size][media=x,1000,750]http://v.youku.com
【第34期】知网精确采集1
知网是一个很典型的网站,搜索关键词是没有独立网址的,所以,如果要采集某个关键词搜索到的文献资料,就不能直接套用层级采集的方法
【第18期】样例复制及翻页
第17期培训给大家讲解了样例复制和层级抓取,本期培训就给大家介绍样例复制和翻页。很多人问过,翻页和层级抓取是否可以共存在一个规则中,其实是可以的,每个规则里都可以同时设置翻页和下级线索,根据下级线索指向
【第19期】 翻页及层级抓取
如果您的采集入口是搜索后的页面,但想要自动点击每条搜索结果,进入到详情页面采数据,这就要用层级采集(对链接设置下级线索),通过链接深入到下一层网页进行采集
第15期在线培训_xpath进阶
[i=s] 本帖最后由 wangyong 于 2018-4-10 17:58 编辑 [/i] [size=4][size=4][size=2][url=http://www.gooseeker.com/doc/forum-53-1.html]网页采集[/url] -> [url=http://www.gooseeker.com/doc/thread-2491-1-1.html]高级视频[/url] -> xpath自定义:精确采集[/size][/size][/size] [media=x,1000,750]http://v.youku.com/v_show/id_XMzAyMzYwNDQxMg==.html[/media] [url=https://pan.baidu.com/s/1b6HwH7_FqtOags1ipL6rNQ]不想看广告?直接下视频[/url]
第24期在线培训_连续动作
[i=s] 本帖最后由 wangyong 于 2018-4-10 17:57 编辑 [/i] [size=4][size=4][size=2][url=http://www.gooseeker.com/doc/forum-53-1.html]网页采集[/url] -> [url=http://www.gooseeker.com/doc/thread-2491-1-1.html]高级视频[/url] -> 连续动作:点击、输入、选择、滚屏、悬浮 [/size][/size][/size][media=x,1000,750]http://v.youku.com/v_show/id_XMjk5MDMzOTAzMg==.html?qq-pf-to=pcqq.c2c[/media] [url=https://pan.baidu.com/s/1CFpVt9lK8WaE_6gTsEEQBQ]不想看广告?直接下视频[/url]
第31期在线培训_图片采集
[i=s] 本帖最后由 wangyong 于 2017-9-18 10:17 编辑 [/i] [size=4][size=2][url=http://www.gooseeker.com/doc/forum-53-1.html]网页采集[/url] -> [url=http://www.gooseeker.com/doc/thread-2488-1-1.html]中级视频[/url] -> 图片采集[/size][/size] [media=x,1000,750]http://v.youku.com/v_show/id_XMjgyNTY0MTIwMA==.html[/media] [url=http://pan.baidu.com/s/1cLxHW6]不想看广告?直接下视频[/url]
第77期在线培训_豆瓣影评
[media=x,1000,750]http://v.youku.com/v_show/id_XMzA1MjMyNzg0NA==.html[/media] [url=https://pan.baidu.com/s/1pKARJqN]不想看广告?直接下视频[/url]
第30期在线培训_翻页集锦
[i=s] 本帖最后由 wangyong 于 2017-9-18 10:16 编辑 [/i] [size=4][size=2][url=http://www.gooseeker.com/doc/forum-53-1.html]网页采集[/url] -> [url=http://www.gooseeker.com/doc/thread-2488-1-1.html]中级视频[/url] -> 翻页集锦 [media=x,1000,750]http://v.youku.com/v_show/id_XMjgyNTY0MTg0OA==.html[/media] [url=http://pan.baidu.com/s/1hr3ZNZu]不想看广告?直接下视频[/url] [/size][/size]
第75期在线培训_法律文书
[i=s] 本帖最后由 HJLing 于 2017-9-19 15:29 编辑 [/i] [media=x,1000,750]http://v.youku.com/v_show/id_XMzAzMjUxNTYxNg==.html[/media] [url=https://pan.baidu.com/s/1hrUc0te]不想看广告?直接下视频[/url]
【第9期培训】xpath基础知识培训
XPath即为XML路径语言,它是一种用来确定XML(标准通用标记语言)文档中某部分位置的语言。
【第33期】精确采集用定位标志
定位标志有两个用途,第一个是限定采集范围,提高定位精确度和规则适应性;第二个就是类似样例复制的作用,可以采集列表数据。
第76期在线培训_法律文书2
[i=s] 本帖最后由 HJLing 于 2017-9-21 09:23 编辑 [/i] [media=x,1000,750]http://v.youku.com/v_show/id_XMzAzNjMxMDg4OA==.html[/media] [url=https://pan.baidu.com/s/1mi7PZQC]不想看广告?直接下视频[/url]