规则名:微博用户搜索页

异常.PNG (15.57 KB, 下载次数: 573)

异常(无认证 后续信息发生错位)

异常(无认证 后续信息发生错位)

正常.PNG (37.41 KB, 下载次数: 538)

正常(有认证 未发生错位)

正常(有认证 未发生错位)
举报 使用道具
| 回复

共 5 个关于本帖的回复 最后回复于 2018-11-7 17:40

沙发
maomao 论坛元老 发表于 2018-11-6 10:54:29 | 只看该作者
可能网页结构不一样。你这是自己写的规则?
举报 使用道具
板凳
Fuller 管理员 发表于 2018-11-6 12:05:39 | 只看该作者
我加载你的规则测试了,没有发现问题,已经修改过了?出现内容串一起,一般都是网页上有相同class造成的,我看这个网页上也没有class,应该是映射不准造成的。另外,认证信息有没有是空的?如果有空的,那里就会空一个,下面的内容就会往上移一个位置,也许会造成移位
举报 使用道具
地板
piggy_ljj 中级会员 发表于 2018-11-7 17:02:47 | 只看该作者
maomao 发表于 2018-11-6 10:54
可能网页结构不一样。你这是自己写的规则?

是的呀
举报 使用道具
5#
piggy_ljj 中级会员 发表于 2018-11-7 17:03:33 | 只看该作者
Fuller 发表于 2018-11-6 12:05
我加载你的规则测试了,没有发现问题,已经修改过了?出现内容串一起,一般都是网页上有相同class造成的, ...

是的,有的认证信息是空的。是不是没办法解决啦?

举报 使用道具
6#
Fuller 管理员 发表于 2018-11-7 17:40:15 | 只看该作者
piggy_ljj 发表于 2018-11-7 17:03
是的,有的认证信息是空的。是不是没办法解决啦?

要自定义xpath,xpath利用网页上的内容,比如“粉丝”这个词,以这个词为参照,这个词后面的数字就是粉丝数。写自定义xpath就会麻烦一些
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-19 17:17