微博转发的这个时间 在做了样例复制之后就都变成了“赞”,是怎么回事?


216.png (3.94 KB, 下载次数: 440)

216.png
举报 使用道具
| 回复

共 1 个关于本帖的回复 最后回复于 2017-10-27 17:23

沙发
umsung 高级会员 发表于 2017-10-27 17:23:42 | 只看该作者
这种情况可能是因为“时间”和“赞”拥有相同的@class值,而在每一个div内,“赞”的节点在“时间“节点之前,如果一个区块节点内有多个@class值相同的节点,爬虫会抓取第一个,所以会出现映射的是时间,抓取到的却是“赞”。
决解办法:
修改定位映射标志,把定位标志改成绝对定位再做样例复制就可以了,这样爬虫就会以位置去精确定位每一个节点

01.png (15.93 KB, 下载次数: 422)

01.png
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-23 18:13