层级抓取,需第一级模拟点击,再到二级抓数据,这种情况需要把“全程模拟点击”和“高仿模拟点击”改为是吗

举报 使用道具
| 回复

共 7 个关于本帖的回复 最后回复于 2017-10-1 21:29

沙发
Fuller 管理员 发表于 2017-10-1 15:57:13 | 只看该作者
是层级抓取吗?你这是为了给第一级设置调度参数吗?如果是给第一级,那么这个模拟点击只是用于翻页点击的
举报 使用道具
板凳
whusim 中级会员 发表于 2017-10-1 16:04:39 | 只看该作者
不知道算不算层级抓取,就是第一级需模拟点击“完整介绍”,然后第二级还是同一个网页,爬取完整介绍里面的文字,这种情况需要修改调度参数里面的全程模拟点击和高仿模拟点击吗
举报 使用道具
地板
whusim 中级会员 发表于 2017-10-1 17:24:30 | 只看该作者
请求解答
举报 使用道具
5#
Fuller 管理员 发表于 2017-10-1 17:39:55 | 只看该作者
whusim 发表于 2017-10-1 16:04
不知道算不算层级抓取,就是第一级需模拟点击“完整介绍”,然后第二级还是同一个网页,爬取完整介绍里面的 ...

调度参数要给第一级设置,第二级不用设置。一般来说不用选择两个模拟点击,如果发现点击不到,再设置
举报 使用道具
6#
whusim 中级会员 发表于 2017-10-1 19:12:04 | 只看该作者
现在就是发现一级规则总是匹配失败,可是一级规则数据匹配只有一个字段,不知道是不是线索匹配出错
举报 使用道具
7#
whusim 中级会员 发表于 2017-10-1 19:18:29 | 只看该作者
一级主题名为b高血压医生列表_个人_信息主页
二级主题名为              b高血压医生列表_个人_信息主页二级                              
                                            





举报 使用道具
8#
Fuller 管理员 发表于 2017-10-1 21:29:20 | 只看该作者
whusim 发表于 2017-10-1 19:18
一级主题名为b高血压医生列表_个人_信息主页
二级主题名为              b高血压医生列表_个人_信息主页二 ...


首先,用上定位标志映射试试。

另外,在教程首页搜索 分析失败线索,能看到很多讲解
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-24 14:51