一级规则:北京律师律师页面跳转
  二级规则: 北京律师查询页面(通过输入批量导入关键字,以姓查询)
   三级规则:北京主要律师信息(查到的律师信息获取,里边有律师详细链接,执行四级任务)
   四级规则:北京详细律师信息

  现在的问题是:

   1. 北京律师查询页面,查询到每一个姓氏的信息获取后,在什么节点退出,重新查询?还是查询完成一个查一个?
   2. 北京律师查询页面,批量导入关键字了,但是每次看任务又没有了,怎么回事。
   3. 北京律师查询页面,查询到律师主要信息,进入三级任务,三级任务执行了,翻页不生效,麻烦看一下
举报 使用道具
| 回复

共 12 个关于本帖的回复 最后回复于 2021-9-13 19:24

沙发
Fuller 管理员 发表于 2021-9-12 09:57:27 | 只看该作者
第二级规则,输入动作那里必须给动作起名字,在会员中心给动作导入更多输入词的时候,一定要填上动作名字。

另外,不要勾 模拟键盘输入

你是旗舰版用户,导入输入词的时候,在第一级导入输入词。一定要填上输入动作的名字
举报 使用道具
板凳
Fuller 管理员 发表于 2021-9-12 10:24:18 | 只看该作者
第二级规则连续动作那里要勾上弹窗模式,因为搜索的时候,会弹出一个新的浏览器窗口
举报 使用道具
地板
Fuller 管理员 发表于 2021-9-12 10:26:31 | 只看该作者
为第三级定义完规则以后,要关闭定义规则的窗口,或者推出定义规则模式。因为这个网站只有唯一一个律师列表窗口,如果还在定义规则状态的时候运行规则,等输入完搜索词,就会跳转到定义规则状态的这个窗口采集数据,在定义规则状态下没法采集数据,就失败了

所以,运行规则前要关闭第三级定义规则窗口
举报 使用道具
5#
Fuller 管理员 发表于 2021-9-12 10:34:59 | 只看该作者
第一级规则有浮动提示框和另外一个提示框,挡住了网页上的输入和点击,所以,一定要关闭他们:



需要定义下面的动作:
1,用悬浮动作把鼠标悬浮在那个浮动的窗口上,如果没有悬浮动作,这个提示框一直在跑,爬虫点不到它。这个动作的xpath是://*[@class='messager-body panel-body panel-body-noborder window-body']/a

2,用点击动作,点击悬浮窗的❌,关闭这个悬浮窗,动作的xpath是://*[@class='messager-button']/a

3,用点击动作,点击提示IE浏览器的那个窗口,动作的xpath是;//*[@class='messager-button']/a

4,点击律师选项

这些动作都需要模拟点击

如果要调整动作的顺序,点击“编排”按钮,进入到排序和编辑界面,拖动一个动作,往上或者往下重排顺序

举报 使用道具
6#
Fuller 管理员 发表于 2021-9-12 10:37:39 | 只看该作者
第三级翻页不了的原因是你没有选对下一页标志,用span元素的class属性作为翻页标志

举报 使用道具
7#
jesscia_2020 高级会员 发表于 2021-9-12 12:26:14 | 只看该作者
Fuller 发表于 2021-9-12 10:37
第三级翻页不了的原因是你没有选对下一页标志,用span元素的class属性作为翻页标志

...

好的,收到。还有要个问题,因为我是按照百家姓来查询的,有可能查询的数据没有数据,碰到这种情况,怎么退出返回上一页呢。
举报 使用道具
8#
jesscia_2020 高级会员 发表于 2021-9-12 12:29:21 | 只看该作者
Fuller 发表于 2021-9-12 10:37
第三级翻页不了的原因是你没有选对下一页标志,用span元素的class属性作为翻页标志

...

另外,如何设置可以从关键词从第一条开始执行,刚才试了一下,不知道从第几天执行的,执行了几个姓氏就结束了,不知道怎么回事。
举报 使用道具
9#
Fuller 管理员 发表于 2021-9-12 13:20:35 | 只看该作者
jesscia_2020 发表于 2021-9-12 12:29
另外,如何设置可以从关键词从第一条开始执行,刚才试了一下,不知道从第几天执行的,执行了几个姓氏就结 ...

导入关键词的顺序与采集的顺序不一样
举报 使用道具
10#
jesscia_2020 高级会员 发表于 2021-9-12 22:56:25 | 只看该作者
Fuller 发表于 2021-9-12 13:20
导入关键词的顺序与采集的顺序不一样

那怎么知道是不是完全执行了呢
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-20 08:14