目录
- 快捷采集
- 初级教程(新版)
- 初级教程(老版)
- 数据转Excel处理
- 爬虫规则管理
- 高级教程(新版)
- 高级教程(老版)
- 用爬虫群分布式高效采集
- 爬虫关键知识拓展
- 问题集锦
- 实战演练案例
- 爬虫安装说明
- 关于集搜客
集搜客交流群
2000人群:点击加入
携程网抓取网页机票
要抓取的携程网网页中的机票,设置的抓取规则相当简单,只有两个一个规则和样例复制,没有翻页。改变抓取网址是自己将某一天的网址批量导入到规则里的,直接导进了爬虫数据。以往都很好用,但是今天出现了匹配失败的问题,重新制作了规则后,仍然有大部分网页出现问题。
携程网上不去了,怎么办?
昨天在携程网上抓取了五个小时左右的数据,今天再抓数据的时候就已经限制访问了,这个怎么处理?
有携程网的采集视频吗
比如采集价格什么的。
携程网景点评论加载不出来
网址:[url]https://piao.ctrip.com/ticket/dest/t56867.html[/url]尝试调整过user agent,无法排除异常,求解
测试页面js 测试插件js
测试页面js 测试插件js 这2个选项是做什么用?
携程网机票抓取出现匹配出错
要抓取的携程网网页中的机票,设置的抓取规则相当简单,只有两个一个规则和样例复制,没有翻页。改变抓取网址是自己将某一天的网址批量导入到规则里的,直接导进了爬虫数据。以往都很好用,但是今天出现了匹配失败的问题,重新制作了规则后,仍然有大部分网页出现问题。
测试规则,提示网页网址过长被截断,这个是怎么处理呢?
测试规则,提示网页网址过长被截断,这个是怎么处理呢? [attach]12294[/attach]
测试帖
测试一下
测试有挺多图 打印出来就变三张
[attach]6121[/attach][attach]6122[/attach] 一个是测试结果 ,一个是XML
携程问答如何采集
请问,携程旅游目的地的问答社区怎么采集,比如关于合肥的问答[attach]15700[/attach]
携程酒店抓取问题!!!!
求大神解答这种情况该怎么处理?这是运用集搜客DIY数据采集出来的结果。
主题:携程每日新闻
按照步骤爬取,为什么不可以翻页,每次采集完第一页就结束采集了
携程酒店抓取问题
是这个地址:[url=https://hotels.ctrip.com/hotels/listPage?06/04[/url] 有如下几个问题: 1、如何实现不断滚屏翻页,这个页面需要拉到最底下,几次以后会出现 “搜索更多酒店
主题名:携程新闻搜索
遇到的问题是不能翻页,个人觉得是线索映射有问题,一般映射都是DIV,在百度页面翻页条只有P,其他都很常规应该没有问题,麻烦帮我看下怎么翻页翻不了,谢谢
携程网评论采集,按照时间排序怎么做
采集携程网的游客评论,想要按时间排序进行采集,求问该怎么定义规则