快捷导航
规则名:微博用户搜索页

异常(无认证 后续信息发生错位)

异常(无认证 后续信息发生错位)

正常(有认证 未发生错位)

正常(有认证 未发生错位)
举报 使用道具
| 回复

共 5 个关于本帖的回复 最后回复于 2018-11-7 17:40

maomao 金牌会员 发表于 2018-11-6 10:54:29 | 显示全部楼层
可能网页结构不一样。你这是自己写的规则?
举报 使用道具
Fuller 管理员 发表于 2018-11-6 12:05:39 | 显示全部楼层
我加载你的规则测试了,没有发现问题,已经修改过了?出现内容串一起,一般都是网页上有相同class造成的,我看这个网页上也没有class,应该是映射不准造成的。另外,认证信息有没有是空的?如果有空的,那里就会空一个,下面的内容就会往上移一个位置,也许会造成移位
举报 使用道具
piggy_ljj 中级会员 发表于 2018-11-7 17:02:47 | 显示全部楼层
maomao 发表于 2018-11-6 10:54
可能网页结构不一样。你这是自己写的规则?

是的呀
举报 使用道具
piggy_ljj 中级会员 发表于 2018-11-7 17:03:33 | 显示全部楼层
Fuller 发表于 2018-11-6 12:05
我加载你的规则测试了,没有发现问题,已经修改过了?出现内容串一起,一般都是网页上有相同class造成的, ...

是的,有的认证信息是空的。是不是没办法解决啦?

举报 使用道具
Fuller 管理员 发表于 2018-11-7 17:40:15 | 显示全部楼层
piggy_ljj 发表于 2018-11-7 17:03
是的,有的认证信息是空的。是不是没办法解决啦?

要自定义xpath,xpath利用网页上的内容,比如“粉丝”这个词,以这个词为参照,这个词后面的数字就是粉丝数。写自定义xpath就会麻烦一些
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 摘取泉港区政府工作报告中的数字遇到的问题
  • 调度设置参数说明
  • 集搜客网络爬虫软件实现自动网页截屏
  • 怎样使用搜狐新闻搜索列表快捷工具抓取关键
  • 用于清洗文本内容的Excel函数公式

热门用户

集搜客GooSeeker网络爬虫 ( 粤ICP备11065265号-2 )

GMT+8, 2019-7-18 00:59