最近在做文旅分析的课题, 想在携程上采集一些旅游景点的在线评论信息,应该怎样着手?
举报 使用道具
| 回复

共 2 个关于本帖的回复 最后回复于 2021-6-15 16:07

沙发
内容分析应用 金牌会员 发表于 2021-6-15 15:56:48 | 只看该作者
这个用现成的快捷采集就可以实现, 分2步:
1. 在携程上搜索景点名称,比如”长隆“

将搜索得到的网址(https://you.ctrip.com/searchsite ... 25bf%25e9%259a%2586)添加这个快捷采集: 携程旅行景点采集_列表
启动数据管家进行采集, 会得到所有景点的网址:就是导出的excel表里的”景点链接“字段

2. 把上一步采集得到的”景点链接“字段添加到这个快捷采集:携程旅行景点采集_评论
启动数据管家进行爬取, 完成后导出excel就可以了


举报 使用道具
板凳
内容分析应用 金牌会员 发表于 2021-6-15 16:07:43 | 只看该作者
你是要做文旅方面的分析, 这里有一篇相关的文章可以参考:《基于文本挖掘的北京市旅游目的地感知形象研究
这是一篇品读文章, 里面有原文链接, 原文运用GooSeeker网络爬虫软件对北京网络游记进行抓取, 采用内容分析法对其分类, 在文献梳理的基础上明确北京旅游感知形象的主要构成维度和北京旅游认知形象的构成量表。


举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-26 09:27