为某个博主写了一个抓取“共同关注”列表的规则,为什么导入相同网页结构的线索抓取不出数据?
之前抓百度新闻、电商页面都没有碰到这个问题
求解答??谢谢谢谢谢谢~~~~

举报 使用道具
| 回复

共 7 个关于本帖的回复 最后回复于 2017-11-20 16:25

沙发
umsung 高级会员 发表于 2017-11-20 15:26:15 | 只看该作者
本帖最后由 umsung 于 2017-11-20 15:31 编辑

1,把样本页面和导入的其他网页网址贴出来看看,不能抓取应该是网页结构有不一样的地方。
2,要么就是你做的规则有问题,适应性不强

参考这个教程修改《怎样解决规则采集失败/遗漏的问题? 》
举报 使用道具
板凳
wangyong 版主 发表于 2017-11-20 15:28:14 | 只看该作者
这个规则现在加载也是会报错,规则重新映射一下,做上定位标志映射
举报 使用道具
地板
栗子桥 新手上路 发表于 2017-11-20 16:07:43 | 只看该作者
umsung 发表于 2017-11-20 15:26
1,把样本页面和导入的其他网页网址贴出来看看,不能抓取应该是网页结构有不一样的地方。
2,要么就是你做 ...

如图 第一个是制作规则用的网页 第二个是要抓取的其他网页

WechatIMG13.jpeg (153.8 KB, 下载次数: 520)

制作规则用的网页

制作规则用的网页

WechatIMG14.jpeg (161 KB, 下载次数: 529)

其他要抓取的网页

其他要抓取的网页
举报 使用道具
5#
栗子桥 新手上路 发表于 2017-11-20 16:09:25 | 只看该作者
umsung 发表于 2017-11-20 15:26
1,把样本页面和导入的其他网页网址贴出来看看,不能抓取应该是网页结构有不一样的地方。
2,要么就是你做 ...

规则是按照教程里 一步一步的制作 发现好像博主使用了相同的皮肤就可以使用相同的规则 反之不适应。是这个原因吗

举报 使用道具
6#
umsung 高级会员 发表于 2017-11-20 16:14:26 | 只看该作者
栗子桥 发表于 2017-11-20 16:09
规则是按照教程里 一步一步的制作 发现好像博主使用了相同的皮肤就可以使用相同的规则 反之不适应。是这 ...

不是,你做的那个规则本身有问题,加载进去后续分析就报错了,重新映射一下抓取内容吧,做上定位映射。
举报 使用道具
7#
栗子桥 新手上路 发表于 2017-11-20 16:24:56 | 只看该作者
umsung 发表于 2017-11-20 16:14
不是,你做的那个规则本身有问题,加载进去后续分析就报错了,重新映射一下抓取内容吧,做上定位映射。
...

好的 解决了 谢谢您

举报 使用道具
8#
栗子桥 新手上路 发表于 2017-11-20 16:25:14 | 只看该作者
wangyong 发表于 2017-11-20 15:28
这个规则现在加载也是会报错,规则重新映射一下,做上定位标志映射

学会了 谢谢您

举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-20 16:16