根据你的描述,还难于判断准确原因,但是这样的网页请注意上图两个红框位置
1)由于大家都用相同的class=b,而MS谋数台自动生成抓取规则的时候会使用这样的定位标志,遇到相同的class,会造成所有抓取内容都抓取第一个单元格。
为了解决这个问题,要人工干预一下,避免MS自动选择class,两个方案
a)自己选择合适的定位标志,做定位标志映射,就会避开MS自动选的。但是这个网页没有更好的
再补充一点,我发现这个网页内容是后加载的,一定要设置 “关键内容”,否则容易漏抓
至于用了样例复制映射抓不到内容,很可能是
1)做内容映射时,选择的DOM节点不是全部来自第一行的内容。一定要选择同一行内容作内容映射
|
共 3 个关于本帖的回复 最后回复于 2016-1-16 09:56