本帖最后由 ym 于 2016-2-1 18:13 编辑

常见问题 > 制作规则—常见问题导航 > 翻页采集 > 设置线索定位首选项解决翻页中断问题

有点不懂的地方求指教,采集淘宝不能自动翻页怎么办?

举报 使用道具
| 回复

共 1 个关于本帖的回复 最后回复于 2015-12-23 23:50

Fuller 管理员 发表于 2015-12-23 23:50:08 | 显示全部楼层
集搜客抓取规则是自动生成的,这样对使用者的技术要求降低了,但是有时候自动生成的抓取规则不是最优的。在网页上,往往会有一些@class和@id可以被用来编写XPath表达式,有时候用@class更好,有时候用@id更好,有时候什么都不用最好。
而程序自动生成xpath的时候,选择的不是最好的,就需要人工做些调整,有个菜单项:配置-〉首选项,可以规定优选class还是id,重新设置一下,会有不同的效果

与翻页有关的问答汇总:http://www.gooseeker.com/doc/thread-698-1-1.html

举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-19 08:25