快捷导航
7 754

记号线索不起作用

hblemon2008 于 2018-2-12 18:03 发表 [复制链接]
file:///C:\Users\ADMINI~1\AppData\Local\Temp\%W@GJ$ACOF(TYDYECOKVDYB.png主题名:loglogo_brand
情况:“下一页"我做个记号线索,但不起作用,只翻到第2页就提示”匹配失效“,帮忙看看呗,谢谢


举报 使用道具
| 回复

共 7 个关于本帖的回复 最后回复于 2018-2-18 09:37

Fuller 管理员 发表于 2018-2-12 20:17:49 | 显示全部楼层
主题名对吗?在管理后台上搜不到。

如果已经翻到第二页,说明翻页规则没有问题。而是抓取数据的规则不适应第二页。最大的可能是每一页上的内容都有唯一的id,可以这样试试,在抓取规则工作台上有个“定位”按钮,点击后选择只用class,可能就好了
举报 使用道具
hblemon2008 高级会员 发表于 2018-2-12 21:51:38 | 显示全部楼层
对不起,主题名:loglogo_brands
举报 使用道具
Fuller 管理员 发表于 2018-2-12 22:07:57 | 显示全部楼层
hblemon2008 发表于 2018-2-12 21:51
对不起,主题名:loglogo_brands

这个网站好像出问题了,现在显示不了网页,要等一下我再试试
举报 使用道具
hblemon2008 高级会员 发表于 2018-2-13 13:24:49 | 显示全部楼层
好的,谢谢
举报 使用道具
Fuller 管理员 发表于 2018-2-13 14:46:17 | 显示全部楼层

这个网站似乎一直有问题,你的规则用的样本页面加载不了
举报 使用道具
hblemon2008 高级会员 发表于 2018-2-18 08:39:26 | 显示全部楼层
春节快乐,今天这个网站可以登录了,麻烦帮我看看,谢谢!
举报 使用道具
Fuller 管理员 发表于 2018-2-18 09:37:08 | 显示全部楼层
定位标志20180218093103.png
主要原因是那个ul的class值在翻页以后就会变化(看红框)。而爬虫在生成抓取规则的时候,会自动用上这个class。

有一个简单的方法:在同一个主题名下定义两个规则,他们的主题名相同,但是在命名主题工作台上使用不同的规则编号。一个规则是原始的规则,另一个是翻页到第二页以后再定义的规则。那么爬虫运行的使用就能自动选择一个合适的。

另一个方法是我上图用的方法,就是避开那个ul的class。那么就手工做定位标志映射,而不用自动选择的。我把整理箱多建了一层,里面那层为了做样例复制映射,外边那层做定位标志映射从而在网页上划定一下范围。另外,点击“定位”按钮,选择绝对定位。那么爬虫在生成抓取规则的时候,除了使用手工选择的定位标志,将不再自动选择其它class和id值
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 批量爬取蘑菇街商品价格、评论信息
  • 微博用户数据分析
  • 批量爬取苏宁商品价格、评论信息
  • 批量爬取亚马逊商品价格、评论信息
  • 批量爬取eBay商品价格、销售情况信息

热门用户

集搜客GooSeeker网络爬虫 ( 粤ICP备11065265号-2 )

GMT+8, 2018-7-18 03:11