为什么我添加网址进去规则里面,添加成功了,但是统计线索还是一条?个人中心的爬虫管理也是显示的一条。


举报 使用道具
| 回复

共 2 个关于本帖的回复 最后回复于 2016-1-20 18:24

沙发
xandy 论坛元老 发表于 2016-1-20 18:19:47 | 只看该作者
你添加的网址过长,目前只支持255长度的网址,所以导入线索的时候,只计算到网址前面255个字符,你添加的这些网址前面部分都是一样的,所以,就记录为一条了。用工具生成短网址,再把短网址导入到规则里,推荐www.waisir.com/t.cn/
举报 使用道具
板凳
Fuller 管理员 发表于 2016-1-20 18:24:54 | 只看该作者
GooSeeker有个优势可能大家没有注意到,就是能够不受自动跳转的影响。用生成短网址的云服务,必然会发生一次跳转,不会影响到抓取过程
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-4 22:12