主题间关系我们以《连续动作的应用场景(一)》为例,因为这个例子比较简单,只有一个连续点击:在网页上连续移动鼠标。没有多层次动作《连续动作的相关概念》那么不好理解。 这个案例只有两个主题,也就是两个抓取规则:
如上图,左边网页是动作施加的对象,在本例,就是鼠标逐个在用户头像上悬浮。右边是悬停后弹出的窗口,其中的内容是用第二个抓取规则进行抓取。
自动化生成连续点击规则如果不能自动化生成连续动作规则,那会怎样?
上图是一个典型的循环流程图,除了敬畏以外,如果目的是数据分析和数据挖掘,非要编排这个流程,似乎有“发明轮子”之嫌。 与之对比,下图是GooSeeker网络爬虫需要做的工作,只需要声明动作的类型和动作施加的对象,那么软件自动实现循环的编排。 上图还展示怎样验证动作施加的对象是否定位准确,V5.3.0版本使用搜索功能,可以验证一个xpath表达式是否有效。在后续版本还会开放连续动作的演示功能,敬请期待。 |