同一个主题名有多个规则,每个网址按照什么顺序去匹配找到适合的规则?
举报 使用道具
| 回复

共 1 个关于本帖的回复 最后回复于 2016-10-20 11:52

沙发
Fuller 管理员 发表于 2016-10-20 11:52:21 | 只看该作者
根据“规则编号”的字母顺序,DS打数机从前到后进行尝试,遇到第一个合适的就停止尝试。所以,一定要注意,不能有通用的规则,否则后面的那些都尝试不到。也就是说,每个规则应该有唯一性的判别标志,并且把这个抓取内容设置上“关键内容”。

同一主题名多个规则只是用来应对网页结构稍许变化的情形,如果是两种完全不同的网页,应该使用不同的主题
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-29 00:16