样例复制
要想提取列表结构的信息,如果只映射一次,就只能提取到一条记录,为了将整个列表的信息提取下
来,这就需要把样本页面上的两个紧相邻的样例(通常是第1和第2个样例)的区块节点做样例复制映射,这样,MS谋数台就会根据其位置计算出一套重复提取的规则,从而,把页面上具有相同结构的信息采集下来。 图4:样例复制 总结一下用户需做的操作是
样例复制其实就是告诉MS谋数台:用户要求在抓取完上一个信息块后还想要抓取下一个,按页面上的自然顺序往下抓取直到将该页面上相同结构信息全部抓取完毕。 图5:相同结构信息 |
oubinke: 那是不是有一种并行操作的意思呢?那同时抓取同一个主题的话,所得到的结果会不会重复呢
bowieD: 每一个规则都可以用一个集搜窗口来运行采集,“与原来的管理窗口同时抓取网页数据”的意思是 是集搜窗口与管理窗口同时抓取同一个主题的网页数据。 ...
oubinke: “点击主题的“集搜”按钮后,弹出“抓取网页”会话窗口,设置抓取线索数量并确定后,将会自动弹出新的简化版DS打数机窗口(集搜窗口),与原来的管理窗口同时抓 ...
a12345617: 什么工具,一点都不会。完全不知道要干什么
waq0902: 单搜和集搜的设置线索数是什么意思?什么情况下线索不是1?