11#
Fuller 管理员 发表于 2019-5-10 17:14:04 | 只看该作者


我做了一个规则,连编号也采集下来了,我发现这个网站的搜索结果会变,编号没有问题,但是,每个编号对应的名字会变。
举报 使用道具
12#
gpy258 初级会员 发表于 2019-5-11 09:52:09 | 只看该作者
Fuller 发表于 2019-5-10 17:14
我做了一个规则,连编号也采集下来了,我发现这个网站的搜索结果会变,编号没有问题,但是,每个编号对应 ...

我也发现了,其实不得不说这是个神奇的网站。这算不算是,一个防止爬虫的方法呢
举报 使用道具
13#
Fuller 管理员 发表于 2019-5-11 10:19:08 | 只看该作者
gpy258 发表于 2019-5-11 09:52
我也发现了,其实不得不说这是个神奇的网站。这算不算是,一个防止爬虫的方法呢
...

一般不会是防爬,而是这个网站的排序算法可能是不稳定
举报 使用道具
14#
gpy258 初级会员 发表于 2019-5-11 10:51:39 | 只看该作者
好的,那有没有什么解决办法呢
举报 使用道具
15#
gpy258 初级会员 发表于 2019-5-11 10:51:53 | 只看该作者
Fuller 发表于 2019-5-11 10:19
一般不会是防爬,而是这个网站的排序算法可能是不稳定

好的,那有没有什么解决办法呢

举报 使用道具
16#
Fuller 管理员 发表于 2019-5-11 15:41:02 | 只看该作者
gpy258 发表于 2019-5-11 10:51
好的,那有没有什么解决办法呢

这种没有好办法,可以多爬几遍,也许能把所有的内容抓到至少一次
举报 使用道具
17#
gpy258 初级会员 发表于 2019-5-11 17:08:27 | 只看该作者
Fuller 发表于 2019-5-11 15:41
这种没有好办法,可以多爬几遍,也许能把所有的内容抓到至少一次

谢谢
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-7 19:52