原理参看《连续动作实战:连续移动鼠标抓取微博浮动窗信息》,定义了两个抓取规则:第一个抓取连续动作执行前的内容;第二个抓取连续动作执行后的内容。定义第一个规则很平常,因为是在一个样本页面上直接定义;而定义第二个抓取规则要比定义普通的抓取规则多几个步骤,因为要抓取的内容是做了动作以后才出现,那么必须先做动作再定义抓取规则。同样的道理,加载和分析以前定义的此类规则的时候,也要先做动作,后做分析,这就是MS谋数台有个“后续分析”菜单的原因。 下面将用图文说明加载过程。 加载过程主题名:微博兴趣搜索_测试悬浮信息_悬浮动作在搜规则工作台上加载如下图,在搜规则工作台上使用关键词“微博兴趣搜索*”可以搜到这个主题,选中后点鼠标右键,选择加载菜单,即开始加载过程。请注意:微博一定要预先在Firefox中登录好。
后续分析过程很快会看到微博网页显示了出来,要一直等待,直到出现一个提示框,关于“后续分析”,如下图。注意:现在不能立马选择“后续分析”菜单,因为鼠标悬停弹出的浮动窗口还没有出现,没有数据可用来分析。
接下来就选择“后续分析”菜单,就完成了加载和分析以前定义的抓取规则。 |