定位标志
把具有属性值(class或id)来做定位标志映射给整理箱的抓取内容,不仅能精确采集范围,还能够大大提高抓取规则的适用性,即便网页结构改变了,在一定程度下,原先的抓取规则也有效。网页结构窗口中的每一行展示一个HTML节点,如果具有id值或class值,可对抓取内容进行定位标志映射,如果该行同时拥有id值和class值时,系统会默认选择id值作为定位标志,但也可手工选择标志值,即在整理箱中双击此抓取内容,在弹出窗口中重新选择id或者class。 |
oubinke: 那是不是有一种并行操作的意思呢?那同时抓取同一个主题的话,所得到的结果会不会重复呢
bowieD: 每一个规则都可以用一个集搜窗口来运行采集,“与原来的管理窗口同时抓取网页数据”的意思是 是集搜窗口与管理窗口同时抓取同一个主题的网页数据。 ...
oubinke: “点击主题的“集搜”按钮后,弹出“抓取网页”会话窗口,设置抓取线索数量并确定后,将会自动弹出新的简化版DS打数机窗口(集搜窗口),与原来的管理窗口同时抓 ...
a12345617: 什么工具,一点都不会。完全不知道要干什么
waq0902: 单搜和集搜的设置线索数是什么意思?什么情况下线索不是1?