GooSeeker集搜客网络爬虫，简单高效的网页采集器

产品服务购买教程社区

目录

快捷采集

如何使用数据DIY采集数据

用法案例-采集微博关键词搜索

用法案例-采集微博博主主页

用法案例-采集知乎数据

用法案例-采集京东评论

去资源库下载规则采数据

用法案例-采集豆瓣影评

用法案例-采集马蜂窝游记

用法案例-采集安居客房源

用法案例-采集前程无忧岗位信息

用法案例-采集微博签到数据

用法案例-采集抖音短视频搜索结果

用法案例-下载商品图片

用法案例-采集天猫商品评论信息

用法案例-采集知乎关键词搜索结果

用法案例-采集微博博主主页内容

初级教程(新版)

核心名词

界面布局介绍

定义规则采数据

采集列表数据

翻页采集数据

下载采集结果

XML格式结果

添加/删除/激活网址

启动数据采集

多机并行采集

加载修改任务

深层采集

内容映射采链接

定位映射提高精度

定位映射采集列表

下载文件

下载弹窗显示的pdf文件

在Excel中插入图片

初级教程(老版)

爬虫的核心名词

采集网页数据

采集列表数据

设置翻页采集

查看数据结果

xml转为excel

添加/激活网址线索批量采集

DS打数机采集数据

规则的修改、另存、删除

采网址做层级采集

定位标志精确采集范围

定位标志采集列表数据

采集图片网址并下载图片

怎样优化DS打数机采集速度

xml文件结构怎么看

数据规则怎么看

采集流程规划-详细版

批量下载网页上的文件

新版采摘浏览器做规则操作

数据转Excel处理

xml转为excel

多层级采集结果合并

把图片导入到excel中

批量修改下载图片名称

xml文件结构怎么看

爬虫规则管理

规则的修改、另存、删除

添加/激活网址线索批量采集

主题、规则、整理箱、线索

高级教程(新版)

连续动作案例

自动搜索关键词

连续点击采集商品价格

滚屏采集瀑布流网页

鼠标悬停信息采集

自动选择下拉菜单

回退返回上级页面

自动搜索关键词时只用规则中的词

特殊网页内容的采集技巧

嵌套整理箱采集多层次数据

网络爬虫抓包功能

利用重加载防止采集中断

更多查看老版高级教程

高级教程(老版)

自定义xpath

如何得到网页信息的xpath

xpath基本知识培训

自定义xpath：精确采集

自定义xpath的问题集锦

连续动作概念

连续动作基础概念

连续动作的界面介绍

如何找到合适的连续动作组合

数据采集爬虫路线连续动作执行顺

连续动作案例

自动搜索关键词采集信息

自动点击采集京东商品价格

滚屏采集瀑布流网页信息

翻页采集悬浮窗信息

自动选择下拉菜单采集数据

把信息与动作步骤对应起来

设置自动返回上级页面

飞掠模式：追踪弹窗采数据

连续打码：破解各种验证码

为瀑布流网页清除老数据

放大或缩小页面

划定滚轮范围

刷新页面动作

采集INPUT的动态内容

自动点击抓取淘宝sku和价格

特殊网页内容的采集技巧

采集网页模块信息

采集网页html源码

嵌套样例复制

在同一个主题名下建立多个规则

爬虫自动换IP

翻页和模拟点击技巧

模拟点击采集评论

相对线索：点击数字翻页

没有数字、文本记号，如何翻页

翻页重复、死循环的解决方法

用爬虫群分布式高效采集

爬虫群介绍：快速采集模式

任务调度设置，用爬虫群快速采数

调度设置参数说明

如何设置周期定时采集

怎样增量抓数据

采集过程中登录网站

在浏览器上手工登录

DS自动登录：不用输入验证

DS自动登录：要输入验证码

爬虫关键知识拓展

HTML基础知识培训

XML基础知识培训

xpath基础知识培训

xpath进阶：精确采集

网页分析工具知识培训

问题集锦

翻页采集集锦

采集网址集锦

样例复制集锦

定位标志映射集锦

采集图片集锦

层级采集集锦

自定义xpath集锦

实战演练案例

亚马逊商品搜索及商品评论采集

网络图片采集下载

安居客房产信息采集

大众点评店铺信息采集

表格型数据采集

抓取中国知网论文数据

采集同一网站的不同网页结构信息

爬虫安装说明

Windows版爬虫软件安装说明

Mac版爬虫软件安装说明

关于集搜客

集搜客产品及服务概述

集搜客爬虫工作原理

企业版软件介绍

集搜客爬虫升级公告

如何使用快捷采集采集数据

如何使用直观标注

联系我们

在线客服：

联系电话：0755-26021359 / 86528616

服务时间：周一至周五 9:30-18:00

集搜客交流群

2000人群：点击加入

模糊搜索精确搜索

搜索热词：

怎样抓取中国知网数据

在中国知网通过高级检索，输入关键词后抓取相关文章的标题、作者、摘要、关键词等信息。但是中国知网在输入关键词搜索后网址并不会发生变化，所以在抓取的时候我们需要爬虫自动输入目标关键词搜索后，开始抓取数据。

采集中国知网数据遇到问题了

我在采集知网数据时，先做了连续动作进行搜索，又做了层级抓取。

第35期在线培训_自定义XPATH精准采集中国知网（下）

4][size=2][url=http://www.gooseeker.com/doc/forum-53-1.html]网页采集www.gooseeker.com/doc/thread-2491-1-1.html]高级视频[/url] -> 自定义XPATH精准采集中国知网

学习《怎样抓取中国知网数据》后实践遇到的问题

参考学习了《怎样抓取中国知网数据》后，遇到了以下问题：1、第二个规则收集到的网址，经过教程指示的修改之后，经复制粘贴无法在正常浏览器中打开=ZGFX201404002&DbName=CJFD2014&DbCode=CJFQ&pr=[/color] 在浏览器中粘贴后打开的页面是知网的首页，而不是进入到某篇论文的详情中。[b][size=3]我的四个规则主题分别为：知网的数据442759129；知网-搜索结果123；知网-文章数据-更多；知网当四个规则如果以上问题都解决后，四个规则是如何结合起来运作的呢——我已经知道第二个规则产生的网址可以给第三个规则当线索，那第一个规则如何使用呢

第34期在线培训_自定义XPATH精准采集中国知网（上）

4][size=2][url=http://www.gooseeker.com/doc/forum-53-1.html]网页采集www.gooseeker.com/doc/thread-2491-1-1.html]高级视频[/url] -> 自定义XPATH精准采集中国知网

中国网民表情报告

网上聊天，除了文字，大家还会用各种表情。据统计，2014年QQ全年表情发送量超过5338亿次，8亿QQ网民中，超过90%在聊天时使用过表情。

学生群体关于“大数据”毕业论文的发展趋势——以中国知网为例 ... ...

自从“大数据”这个名词在几年前突然闯进人们的生活之后，仿佛在各行各业都能看到它的身影，就连学生群体写毕业论文时也不放过“大数据”，那么，学生群体在研究大数据时都在研究些什么呢？集搜客数据分析实验室对此 ...

中国商标网数据采集

sbcx.saic.gov.cn:9080/tmois/wsggcx_getGongGao.xhtml[/url] 这是商标网的地址

中国土地网抓取问题

老师您好，中国土地网的网站，我找到要采集的页面后开始制定规则，但发现真正运行规则时，限定的北京市的条件，又被取消了，这是个什么原因呢

中国政府采购网数据采集

网址是，中国政府采购网[url]http://www.ccgp.gov.cn/cggg/dfgg/gkzb/[/url]

中国土地市场网——怎么选定区域？

tabid=262[/url] 图中红框的这种，点击后会出现右面的一个小框，规则应该怎么做？

中国土地市场网爬取数据问题

老师您好，我在爬取中国土地市场网（[url=https://www.landchina.com/]https://www.landchina.com

中国农药信息网页面中弹出层是否能采集

http://www.chinapesticide.gov.cn/hysj/index.jhtml[/url] 点击列表中的链接

python爬取知网

我想用python爬取知网的数据，这个要怎么做

《网络问答社区“知乎”的知识分享与传播行为研究》中提到的“小世界”网络是指什么？

昨天的那篇案例研究文章《[url=https://www.gooseeker.com/doc/article-609-1.html]网络问答社区“知乎”的知识分享与传播行为研究[/url]》, 里面有提到：三个结论:首先是整体网呈现一个典型的"小世界"网络关系,其节点呈幂律分布

上一页 1 2 3 ... 373 下一页

MetaSeeker盛大升级
首页
产品教程社区
支持
常见问题视频教程速查手册旧版社区
关于
公司简介产品功能服务购买联系方式
联系
邮箱：info@gooseeker.com
热线1：0755-86528616

热线2：0755-26021359

咨询：
关注官方微信

应用版本：V9.0 | 更新时间：2023年8月22日 | 隐私策略 | 应用权限 | 版权所有 © 2007-2023 GooSeeker 深圳市天据信息技术有限公司

粤ICP备08108565号-1

粤公网安备44030502004363号