采集京东商品评论数据时怎样按时间排序进行抓取?
举报 使用道具
| 回复

共 2 个关于本帖的回复 最后回复于 2021-4-27 17:45

wangyong 版主 发表于 2021-4-27 17:45:29 | 显示全部楼层
1,在集搜客数据管家中进入快捷采集选择京东商品评论_按时间排序采集

数据管家-京东商品按时间排序.png
2,输入要采集的商品链接,如果要采集多个商品链接则选择“输入多条网址”按钮批量粘贴
评论按时间-输入网址.png
输入完网址后点击“获取数据”按钮,爬虫就开始采集数据了
3,快捷采集后台的采集状态变为“已采集”时,就可以点击打包下载Excel格式的数据了
京东时间快捷采集后台.png
4,数据展示:
按时间排序Excel.png

举报 使用道具
wangyong 版主 发表于 2019-10-21 16:46:13 | 显示全部楼层
京东时间排序.png
做连续动作的层级采集可以进行按时间排序
1,点击商品评论,定位xpath://*[@class='tab-main large']/ul[position()=1]/li[position()=5]
2,悬浮排序位置,定位xpath://*[@class='J-current-sortType']
3,点击时间排序,定位xpath://*[@class='J-sortType-item']
第一级规则是只做上面3个动作,然后在目标主题名中填写下级规则,下级规则执行抓取评论



举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-19 01:24