我看到集搜客有采集马蜂窝游记的快捷工具,可是游记列表的链接怎么获取?比如我要采集这个景点的游记 https://www.mafengwo.cn/poi/34390.html
举报 使用道具
| 回复

共 1 个关于本帖的回复 最后回复于 2021-10-5 17:05

Fuller 管理员 发表于 2021-10-5 17:05:13 | 显示全部楼层
首先要进入马蜂窝游记列表,使用采集列表工具采集到每篇游记的网址,然后采用采集详情的工具,采集每篇游记的详细内容。

1,找某个城市的游记列表
游记列表是放在“目的地”大板块下的,在这个大板块下选择某个省的某个市,如下图,点击“中卫”
目的地35.png

2,进入到游记列表页
游记列表页放在“社区”下的,如下图,点击社区下的“游记”
游记09.png

3,使用马蜂窝游记列表快捷采集工具,采集一个城市的所有游记
把上面看到的网址拷贝到快捷采集工具,就可启动采集。仔细观察这个网址:https://www.mafengwo.cn/yj/18790/ ,可以发现,yj就是代表“游记”,18790是城市编号,如果手上有马蜂窝的所有城市编号,可以直接构造游记列表网址,导入到快捷采集工具中。
快捷09.png
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-19 09:00