悬浮显示的微博个人信息
如上图,在新浪微博上,想把所有对“登山”有兴趣的人的信息采集下来,鼠标移动到每个头像上,悬浮一会就会显示一个弹出窗体。在一个一个头像上做悬浮动作,这就称为“连续”动作,也就是对同一样的动作重复多次。
命名主题主题是集搜客GooSeeker的专用名词,一个主题表示采集一个特有的抓取结果,对应于网页上的内容结构。比如,采集一个人的:{ 姓名,年龄,性别 }是一个主题,而采集{ 姓名,工作经验,是否程序员,所属行业 }是另一个主题。
上述抓取规则可以直接下载用于练习。详细的原理解释请参看《原理:不用规定怎样循环,软件自动安排连续动作》。
抓取效果
运行的时候,要从第一个主题开始,不能单独运行第二个主题,就会看到第一个主题把兴趣搜索出来,马上激活第二个主题,把鼠标挨个悬浮在每个人的头像上,等弹出窗口显示出来后,把个人信息采集下来。 |