本帖最后由 xlt148107 于 2017-2-16 11:09 编辑

采集Ajax异步加载的信息,点击某个按钮加载信息,加载出来是两层html结构的信息,加上外层html一共三层html,但是我试过利用高级设置采集整个html,但是异步加载的那两层html采集不了,这种该怎么去处理啊?

举报 使用道具
| 回复

共 3 个关于本帖的回复 最后回复于 2017-2-16 11:42

沙发
ym 版主 发表于 2017-2-16 11:18:20 | 只看该作者
估计要做多级规则。首先通过连续动作设置对应的点击动作,加载出想要的信息后再做采集。详情操作看连续动作系列教程掌握http://www.gooseeker.com/tuto/tutorial.html

举报 使用道具
板凳
xlt148107 初级会员 发表于 2017-2-16 11:27:10 | 只看该作者
ym 发表于 2017-2-16 11:18
估计要做多级规则。首先通过连续动作设置对应的点击动作,加载出想要的信息后再做采集。详情操作看连续动作 ...

我做了连续动作,把要采集的信息通过连续动作的点击点开,指向目标主题的采集规则,但是该采集规则在第一页时能采集成功,第二页就会失败了,会显示采集规则不适合,然后整个采集工作就告终了,是不是这个点击出来的网页结构是两层html的缘故啊?

举报 使用道具
地板
ym 版主 发表于 2017-2-16 11:42:50 | 只看该作者
加载规则对第二页分析一下,操作参考《怎样解决规则采集失败/遗漏的问题》
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-5 15:06