文档

【第53期】热点新闻采集
【第53期】热点新闻采集
互联网上有很多新闻门户网站,它们各自的网页结构都不相同,要采集不同新闻网站发布的新闻全文信息,就要分别做采集规则,例如,通过百度新闻搜索到的是大部分新闻门户网站的新闻摘要,这里是以百度规定的网页结构显 ...

2017-5-12 11:50

【第55期】汽车之家论坛采集培训
【第55期】汽车之家论坛采集培训
采集论坛上的信息,不用一个个帖子采集,通过集搜客爬虫可以实现批量化采集。首先论坛有多个版块的情况,要以一个版块为模板,找到该版块的帖子列表,做第一级采集规则,要把所有帖子的网址采集下来,这是为了下一步 ...

2017-5-12 11:11

知乎话题结构分析
知乎话题结构分析
请注意:一定要用爬虫群模式运行,请仔细看下面的说明。一、采集规则主题名:知乎话题结构分析下载地址:二、运行方法下载了本规则以后,要进入会员中心, ... ... ... ... ... ...

2017-3-29 23:37

【第52期】今日头条热点新闻采集
【第52期】今日头条热点新闻采集
用集搜客网络爬虫来采集新闻,可以免除人力的烦琐,做好规则就能轻松地批量采集新闻信息。具体操作是:要分别对新闻列表页面和新闻详情页面做采集规则,第一级规则用于采集新闻列表,先把单条的新闻标题、摘要、链接 ...

2017-3-22 15:31

【第51期】赶集网、58同城、房天下房源采集
【第51期】赶集网、58同城、房天下房源采集
利用数据DIY的现成爬虫,可以免做规则,找到想要采集的网页类型,直接添加网址就能采集数据,非常简便省事。本次培训主要是讲解房地产的房源信息采集,以赶集网、58同城、房天下为例,讲解直接用数据DIY上面提供的现 ...

2017-3-13 17:47

【第50期】安居客、链家、Q房网房源采集
【第50期】安居客、链家、Q房网房源采集
利用数据DIY的现成爬虫,可以免做规则,找到想要采集的网页类型,直接添加网址就能采集数据,非常简便省事。本次培训主要是讲解房地产的房源信息采集,以安居客、链家、Q房网为例,讲解直接用数据DIY上面提供的现成 ...

2017-3-13 17:39

【第49期】微博话题、粉丝、评论转发采集
【第49期】微博话题、粉丝、评论转发采集
利用数据DIY的现成爬虫,可以免做规则,找到想要采集的网页类型,直接添加网址就能采集数据,非常简便省事。本次培训主要是讲解从微博话题做为入口,如何一步步拓展采集更多信息。简单来说,通过微博话题可以采集到 ...

2017-3-13 17:26

【第48期】微博转发、微博评论和视频采集
【第48期】微博转发、微博评论和视频采集
用数据DIY版块现成的爬虫程序,可以免做规则,直接添加网址就能采集数据。本期培训继续给大家推荐采集微博转发、微博评论、微博视频信息的爬虫程序。注意,要在火狐/GS爬虫浏览器上先登录微博,再来采集微博数据,并 ...

2017-2-23 17:12

【第47期】微博关键词搜索、博主主页、资料采集
【第47期】微博关键词搜索、博主主页、资料采集
集搜客新上线了数据DIY版块,提供了很多热门网页的爬虫程序,现在大伙可以不用做规则了,直接添加网址就能采集数据啦。本期培训就给大家推荐一下微博关键词搜索、博主主页、博主资料这三块怎样进行关联性地批量采集 ...

2017-2-23 16:55

【第46期】洋码头商品搜索及详情采集
【第46期】洋码头商品搜索及详情采集
本次培训是以洋码头为案例,讲解如何批量采集商品搜索页面以及商品详情。对于这种具有网址关联的两级网页,只要做两级规则。第一级规则用来采集第一级网页,即商品搜索列表页面,除了直观标注外,还要做样例复制、翻 ...

2017-1-20 10:06

【第45期】兰亭集势商品信息及评论采集
【第45期】兰亭集势商品信息及评论采集
本期培训将会系统地讲解兰亭集势网站数据的采集,从关键词搜索到的商品列表、商品详情信息到商品的评论,总共是做三级规则来采集。第一级规则负责采集关键词搜索到商品列表信息,并设置了下级线索和自动翻页;第二级 ...

2017-1-12 18:06

【第44期】wish商品搜索、商品详情、评论信息采集
【第44期】wish商品搜索、商品详情、评论信息采集
本次培训将会系统地讲解wish网站的数据采集,主要是通过关键词搜索作为采集入口,一层层地深入采集商品列表信息、商品详细信息、商品评论信息,所以,对应着这三层网页,要做三级规则,第一级规则负责采集商品列表信 ...

2017-1-10 18:01

【第41期】ebay网商品搜索及详情页面采集
【第41期】ebay网商品搜索及详情页面采集
本期培训会以ebay网为案例,讲解如何采集商品搜索页面和商品详情页面,这是两级页面,所以要对应做两级规则。第一级规则负责采集商品搜索页面,要做样例复制、设置下级线索、设置翻页线索(本案例用记号线索),产生 ...

2016-12-16 10:26

【第40期】亚马逊商品搜索及商品评论采集
【第40期】亚马逊商品搜索及商品评论采集
本期培训讲解亚马逊的数据采集,首先是采集商品的搜索页面,然后是采集商品信息,最后是采集商品评论,刚好是三层级的网页,所以,要做三级采集规则,通过采集网址并设置下级线索,可以把这三级规则串在一起,达到的 ...

2016-12-8 17:13

【第39期】用数据DIY自动获取数据
【第39期】用数据DIY自动获取数据
集搜客上线了数据DIY功能,覆盖金融、电商、社交、房地产等多种网站,让你免除做规则,直接获取网页数据,它的使用方法也非常简单,只需选择想要采集的网页数据,输入关键词/网址,就可以启动爬虫来获取数据,最后直 ...

2016-12-5 17:28

热门排行

关注我们

GMT+8, 2024-12-21 21:20