网址:https://piao.ctrip.com/ticket/dest/t56867.html
尝试调整过user agent,无法排除异常,求解


火狐浏览器正常打开的页面

火狐浏览器正常打开的页面

gooseekerPC端打开的异常页面

gooseekerPC端打开的异常页面
举报 使用道具
| 回复

共 4 个关于本帖的回复 最后回复于 2021-5-6 17:39

wangyong 版主 发表于 2021-5-6 17:39:13 | 显示全部楼层
本帖最后由 wangyong 于 2021-5-6 17:43 编辑

使用集搜客的快捷采集可以直接采集携程景点评论的数据,使用步骤如下:1,安装集搜客数据管家,进入快捷采集,选择携程旅行景点采集_评论
数据管家-景点评论.png
输入要采集的景点链接,例如:https://you.ctrip.com/sight/qingdao5/109785.html
选择要采集的页数后,点击“获取数据”按钮,爬虫就可以采集数据了
2,在快捷采集后台管理中观察到采集状态为“已采集”后,就可以打包下载Excel格式的数据了。
景点评论-快采后台.png
3,数据展示:
景点评论-Excel.png
举报 使用道具
Fuller 管理员 发表于 2019-10-24 14:05:07 | 显示全部楼层
这些信息需要集搜客网络爬虫新版本才能采集,很快就会发布
举报 使用道具
Fuller 管理员 发表于 2020-2-26 23:16:44 | 显示全部楼层
2020年2月26日发布的 集搜客采摘浏览器 V1.0.7版 是可以采集携程评论的。

V1.0.7版是以摘录功能为主发布的,所以,没有在网络爬虫软件下载那里下载,而是要到 摘录软件那里下载: 集搜客报表摘录软件

其实 集搜客采摘浏览器 是一个综合软件,既可以摘录零散的数据,也可以用网络爬虫批量采集数据。

下图:把携程景点网址加载到 集搜客采摘浏览器 上,点击左边工具条上的定义规则按钮,就能把MS谋数台运行起来,定义规则。

携程20200226230630.png

定义规则完成后,不要用DS打数机运行,因为DS大数据也显示不出来评论,还是要用 集搜客采摘浏览器运行。如下图,点击任务管理,在那个任务上点击启动采集

采集20200226231426.png


举报 使用道具
Fuller 管理员 发表于 2020-3-11 17:03:33 | 显示全部楼层
具体步骤参看这个帖子《用集搜客采摘浏览器采集京东拍卖信息
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-19 06:12