发现网址的地位标志会改变,尝试了将它冻结后再定义,终于翻了第二页,但是没有爬到第二页的数据,之后就说匹配失败就结束了。
主题:去哪儿鼓浪屿2
网址:https://piao.qunar.com/ticket/de ... =mps_search_suggest
用MS谋数台后续分析后,没有输出信息
麻烦各位大大帮忙看看,感激不尽
举报 使用道具
| 回复

共 4 个关于本帖的回复 最后回复于 2019-8-9 18:01

沙发
Fuller 管理员 发表于 2019-8-8 15:15:11 | 只看该作者
我测试了,翻页没有问题,加载规则到MS谋数台上也没有问题。但是在DS打数机上翻页到第二页以后就匹配失败了,说明整理箱里面应该做上定位标志映射提高规则的精度
举报 使用道具
板凳
Fuller 管理员 发表于 2019-8-8 15:16:44 | 只看该作者
好奇怪,第二次加载规则就失败了,我试试加上定位标志
举报 使用道具
地板
Fuller 管理员 发表于 2019-8-8 15:26:43 | 只看该作者





上图分别是第一页和第二页的html DOM,可以看到,到第二页,每条评论的html节点变成了DIV,不再是LI了。用样例复制映射的话,生成的xpath中含有节点的名称,这样就不适用了。这个网页上刚好有很好的定位标志,因为每条评论都有相同的class,所以,我取消了样例复制,而是用定位标志映射提取多条评论,这样就好了。用定位标志提取评论列表的教程:https://www.gooseeker.com/doc/article-347-1.html


本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
5#
dachengzi 初级会员 发表于 2019-8-9 18:01:14 | 只看该作者
嗯嗯可以了谢谢大佬
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 利用AI阅读和分析文本:扣子COZE记录用户反
  • 在网页片段内直观标注——以B站评论采集为
  • 利用AI阅读和分析文本:使用COZE建设游记文
  • 使用AI工具Kimi生成python代码为文本分析结
  • 苹果mac电脑安装集搜客网络爬虫软件失败的

热门用户

GMT+8, 2024-11-24 12:18