想请问一下,快捷采集可以采集携程选定星级的酒店评论吗?

举报 使用道具
| 回复

共 4 个关于本帖的回复 最后回复于 2020-4-29 15:55

Fuller 管理员 发表于 2020-4-29 12:25:41 | 显示全部楼层
在快捷采集里面的规则,通常都不做特殊的筛选。尤其像筛选星级,即使自己做规则,用规则筛选,也不要这样做。比如,翻页采集的时候,假设到第三页,符合星级要求的一条数据都没有,而第四页或者后面的页上都符合要求的。但是,到了第三页,因为符合要求的数据,翻页就中断了。

所以,正确的做法是:把各种星级的内容都采集下来,然后过滤掉不要的。

这个采集一般要分两级:
第一级:把所有星级的酒店网址都采集下来,包括星级这个值。然后把结果导出到excel中,通过排序,把符合星级的网址拷贝出来,添加到第二级
第二级:负责采集评论
举报 使用道具
蓝霄子Bob 初级会员 发表于 2020-4-29 14:12:36 | 显示全部楼层
Fuller 发表于 2020-4-29 12:25
在快捷采集里面的规则,通常都不做特殊的筛选。尤其像筛选星级,即使自己做规则,用规则筛选,也不要这样做 ...

好的,太感谢了。
举报 使用道具
蓝霄子Bob 初级会员 发表于 2020-4-29 15:54:11 | 显示全部楼层
那评论里不同出游类型可以用快捷采集吗?
举报 使用道具
lan_1985 金牌会员 发表于 2020-4-29 15:55:56 | 显示全部楼层
蓝霄子Bob 发表于 2020-4-29 15:54
那评论里不同出游类型可以用快捷采集吗?

可以爬出来后,下载数据后再筛选的

QQ图片20200429155520.png


举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-3-29 09:42