我在爬取旅游网站的评论,可是评论很长需要点击阅读全部后面的内容才会出来怎样设置可以把后面阅读全部的完整评论爬去下来呢,请大神们指点啦 谢谢

11111111111.png (242.08 KB, 下载次数: 905)

11111111111.png
举报 使用道具
| 回复

共 6 个关于本帖的回复 最后回复于 2018-6-2 13:51

沙发
小宇宇嘻嘻嘻 初级会员 发表于 2018-6-2 09:35:01 | 只看该作者
举报 使用道具
板凳
Fuller 管理员 发表于 2018-6-2 09:45:21 | 只看该作者
用连续动作,用点击类型就可以,连续动作的意思是“连续不断”地做一组动作,在这里也就是逐个点击“阅读全部”。具体要看高级教程里面的连续点击
举报 使用道具
地板
小宇宇嘻嘻嘻 初级会员 发表于 2018-6-2 09:52:44 | 只看该作者
Fuller 发表于 2018-6-2 09:45
用连续动作,用点击类型就可以,连续动作的意思是“连续不断”地做一组动作,在这里也就是逐个点击“阅读全 ...

哇塞 好棒,但是我点开看了看您发的具体要看的那篇文章 太复杂了。。。。我换个网址试试吧要不但还是非常感谢您 我觉得集搜客挺好用的还是

举报 使用道具
5#
小宇宇嘻嘻嘻 初级会员 发表于 2018-6-2 10:34:59 | 只看该作者
Fuller 发表于 2018-6-2 09:45
用连续动作,用点击类型就可以,连续动作的意思是“连续不断”地做一组动作,在这里也就是逐个点击“阅读全 ...

我试了,但好像我这个点击了展开全部以后的内容在谋数台的浏览器上没法显示
所以就无法用xpath定位 就没办法把展开后的评论爬取下来
这要怎么办呢

举报 使用道具
6#
数据集 高级会员 发表于 2018-6-2 12:02:50 | 只看该作者
小宇宇嘻嘻嘻 发表于 2018-6-2 10:34
我试了,但好像我这个点击了展开全部以后的内容在谋数台的浏览器上没法显示
所以就无法用xpath定位 就没 ...

在谋数台的浏览器的上部有个内容定位的选中框,取消勾选内容定位,就可以点击展开全部,展开全部后,再勾上内容定位,规则-》刷新页面结构后再做规则。

1.png (8.86 KB, 下载次数: 902)

1.png

2.png (10.23 KB, 下载次数: 888)

2.png
举报 使用道具
7#
小宇宇嘻嘻嘻 初级会员 发表于 2018-6-2 13:51:40 | 只看该作者
数据集 发表于 2018-6-2 12:02
在谋数台的浏览器的上部有个内容定位的选中框,取消勾选内容定位,就可以点击展开全部,展开全部后,再勾 ...

哇 太谢谢你啦 我试试
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-26 22:17