11#
Fuller 管理员 发表于 2017-5-2 10:40:43 | 只看该作者
用这个定位点击点是可以的
  1. //*[@class='WB_text_opt' and contains(text(),'展开全文')]
复制代码


并不是要求所有的xpath中都这样包含一个标志,例如,“展开全文”,但是这个网页很适合,而且点开以后这个标志也存在。这样利用这个xpath表达式找到的节点数量保持不变,一定要保持不变,否则,节点排序就会出错


举报 使用道具
12#
Ursula 初级会员 发表于 2017-5-2 11:01:11 | 只看该作者
Fuller 发表于 2017-5-2 10:40
用这个定位点击点是可以的

并不是要求所有的xpath中都这样包含一个标志,例如,“展开全文”,但是这个网 ...

(唉我都不好意思回复了)大神我之前就尝试了前一个(//*[@class='WB_text_opt']/@action-type)。然后运行的时候好像连续动作一直找不到他所以就一直停在第一页不动了,后一个(加展开全文标志)也还是没有点开。
会是我电脑或者网络的原因么?
真是麻烦您了。
太谢谢您了!

举报 使用道具
13#
Fuller 管理员 发表于 2017-5-2 17:20:43 | 只看该作者
Ursula 发表于 2017-5-2 11:01
(唉我都不好意思回复了)大神我之前就尝试了前一个(//*[@class='WB_text_opt']/@action-type)。然后运 ...

我测试了一下,很可能是软件版本问题。最近要发布V8.2.0版本,但是因为一些事情给耽误了。如下图



垂下来的这一条,很可能把要点击的位置盖住了,可以尝试两个方案:
1,在点击动作的高级设置中,不要勾选“模拟点击”
2,你在qq群里面?如果在,与qq群管理员联系,给你一个最新的临时版本。如果没有加入qq群,加入:GooSeeker集搜客网络爬虫 472442022
举报 使用道具
14#
wangyong 版主 发表于 2020-12-15 16:39:17 | 只看该作者
本帖最后由 wangyong 于 2020-12-15 16:40 编辑

集搜客的快捷采集中有微博展开全文采集入口,添加需要展开全文的微博独立链接就可以进行采集。
数据展示:

举报 使用道具
15#
杨庆123456 初级会员 发表于 2021-11-26 13:33:13 | 只看该作者
wangyong 发表于 2020-12-15 16:39
集搜客的快捷采集中有微博展开全文采集入口,添加需要展开全文的微博独立链接就可以进行采集。
数据展示:
...

如图操作后,数据爬取结束后显示失败......不知道哪里出问题了
举报 使用道具
16#
gz51837844 管理员 发表于 2021-11-26 15:36:01 | 只看该作者
杨庆123456 发表于 2021-11-26 13:33
如图操作后,数据爬取结束后显示失败......不知道哪里出问题了

你把你添加的链接发几条出来,我们测试下
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-27 06:27