本帖最后由 Automobile86 于 2018-4-10 13:58 编辑



主题名为:【2018】搜狗微信搜索


在谋数台测试时候发现   xpath定位为:  //*[@class='txt-box'] 的采集数据有10个,结果测试的时候发生 输出信息里只有1个模块的采集数据,即样例复制失败了。

本人折腾这个一个早上了,求解问题出在哪里。。



补充:自己发现原来是 自定义xpath语句影响了抓取。


举报 使用道具
| 回复

共 6 个关于本帖的回复 最后回复于 2018-4-10 15:53

沙发
shengchengx 金牌会员 发表于 2018-4-10 14:05:50 | 只看该作者
检查你的规则的好像没有问题呢
举报 使用道具
板凳
Automobile86 中级会员 发表于 2018-4-10 15:07:48 | 只看该作者
shengchengx 发表于 2018-4-10 14:05
检查你的规则的好像没有问题呢

你好,感谢指点。我发现自己发现原来是 自定义xpath语句影响了抓取。

我给标题加了自定义Xpath之后,每一页所有的标题都变成了 第一列的标题。你知道为啥不。。

举报 使用道具
地板
wangyong 版主 发表于 2018-4-10 15:09:30 | 只看该作者
xpath前面要加“.”,这样就不会抓只抓第一列的标题
举报 使用道具
5#
Automobile86 中级会员 发表于 2018-4-10 15:15:59 | 只看该作者
wangyong 发表于 2018-4-10 15:09
xpath前面要加“.”,这样就不会抓只抓第一列的标题

大神厉害了,学习了。。
不过你刚才提到的这一点在教程里好像没有提到。
举报 使用道具
6#
wangyong 版主 发表于 2018-4-10 15:21:28 | 只看该作者
你看的哪个教程?
举报 使用道具
7#
Automobile86 中级会员 发表于 2018-4-10 15:53:51 | 只看该作者
wangyong 发表于 2018-4-10 15:21
你看的哪个教程?

刚才翻了一下,看到高级教程——自定义xpath的教程中有。感谢提醒哈
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 为什么用微软的excel无法打开xls文件?powe
  • 360或火绒等杀毒软件导致GooSeeker爬虫软件
  • 话题分析(NMF模型和LDA模型)软件的安装和
  • 运行Apple无法验证的程序的方法
  • 文本聚类分析软件的安装和使用方法

热门用户

GMT+8, 2025-7-12 07:05