规则名,‘微博_博主1’,‘微博_博主2’,刚制定完规则好使,跑完后,在‘微博_博主1’中再添加同样的网址,添加不上,怎么回事
举报
| 回复

共 4 个关于本帖的回复 最后回复于 2018-10-29 18:09

沙发
Fuller 管理员 发表于 2018-10-29 14:43:34 | 只看该作者
会做重复判断的,如果你想再次抓取以前的网址,激活线索就行。参看:https://www.gooseeker.com/doc/thread-667-1-1.html
举报
板凳
zhenghy 中级会员 发表于 2018-10-29 14:58:37 | 只看该作者
不是,我添加不同的网址 ,网页结构是一样的,再次添加就不好使了
举报
地板
zhenghy 中级会员 发表于 2018-10-29 17:45:04 | 只看该作者
人呢
举报
5#
Fuller 管理员 发表于 2018-10-29 18:09:17 | 只看该作者
zhenghy 发表于 2018-10-29 14:58
不是,我添加不同的网址 ,网页结构是一样的,再次添加就不好使了

网页结构看起来一样,不一定在规则层面上一样。用这个方法加载和分析失败线索:https://www.gooseeker.com/doc/article-231-1.html
举报
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 360或火绒等杀毒软件导致GooSeeker爬虫软件
  • 话题分析(NMF模型和LDA模型)软件的安装和
  • 运行Apple无法验证的程序的方法
  • 文本聚类分析软件的安装和使用方法
  • 利用AI阅读和分析文本:扣子COZE记录用户反

热门用户

GMT+8, 2025-5-6 17:22