目录
- 快捷采集
- 初级教程(新版)
- 初级教程(老版)
- 数据转Excel处理
- 爬虫规则管理
- 高级教程(新版)
- 高级教程(老版)
- 用爬虫群分布式高效采集
- 爬虫关键知识拓展
- 问题集锦
- 实战演练案例
- 爬虫安装说明
- 关于集搜客
集搜客交流群
QQ群:点击加入
翻页得到的多页数据怎么一次性导入Excel
翻页得到的多页数据怎么一次性导入Excel
在网页上导出数据得到的怎么是前几天的数据呀?不是这次爬的数据
请问一下,在网页上导出数据得到的怎么是前几天的数据呀?不是这次爬的数据
翻页时,一次翻多页
saygoodbye163 于 2016-11-22 00:01 编辑 [/i] 比如说,我想要采集1,4,7,10页,也就是一次翻3页,怎么做?
软件获得的数据,怎么导入数据库?
用的是集搜客爬虫软件获得的数据,怎么导入自己的数据库?
gooseeker怎么一次爬微博多页的数据
gooseeker怎么一次爬微博多页的数据
XML导入到Excel中崩溃怎么办?
大概有6000个XML文件,按理说这个数据量也不是很大。XML导入到Excel中时候,Excel一直处于等待状态,已经等了10分钟了。当遇到万级以上的数据,就不能用这个XML转Excel宏文件了吗?
怎样从网页上一次性下载多个pdf文件?
比如这个网站:[url]https://www.iau-aiu.net/Publications[/url] 上面有很多跟大学教育有关的政策文件,都是pdf格式的。我要下载下来,但是这些文件的链接散布在文字中,没法定义样例复制规则。有办法像下载图片和视频那样一次下载多个pdf文件吗?
翻页太慢导致同一页反复抓取多次,如何解决?
爬虫主题:网易房产数据中心 翻页时使用的是相对线索,可以正常翻页,但是翻页速度较慢,前面几页大概半分钟翻一次页,导致同一页反复抓取了3次;越往后翻页速度越慢,重复抓取越多,到第49页似乎完全停止翻页,但是抓取动作持续进行。
一翻十页,不一定多少页的怎么翻页采集啊
[attach]2370[/attach] 像这种翻页,怎么设置
导出的数据比导入的数据多?
我导入的数据有300多条,但是导出来后有1000多条了,这是什么原因?
怎么限制翻页次数?
网址翻页到50页后,重新会到第1页了,我点击页码或是输入页码都不行,能设置下翻页次数,翻到50页就结束吗?
往规则导入一批网址,但得到的线索数量不对
情景:用excel复制一大堆网址进规则线索,得到的线索数不齐,复制一万条才有几千条线索 [b]解答:[/b] 1、重复网址会被过滤 2、手工导入的网址有长度限制,超过255个字符的话,就导入不了,这种情况,去百度找把长网址转换为短网址的工具,然后把短网址导入 3、如果网页上有这些网址,可以做层级规则抓取,把抓到的网址自动导入到下级规则中
怎样一次性抓取多行文字
[b]问[/b]:如果想要一次性抓取多行文字,而这些文字每个都是独自一行,一个个弄太吃力了,而且有的介绍是3行,也许有的是有没有人可以指导一下,一次性把这些都抓取下来 [align=center][attach]272[/attach][/align] [align=left]其id和class全部是空着的,没有办法进行定位映射[/align] [align定位映射不是必须的。要用TD这样的html节点做内容映射的话,先要做 高级设置,如下图[/align] [align=center][attach