如图:
相关设置:





举报 使用道具
| 回复

共 24 个关于本帖的回复 最后回复于 2016-11-30 16:39

沙发
xandy 论坛元老 发表于 2016-11-29 11:03:46 | 只看该作者
举报 使用道具
板凳
cs3520 初级会员 发表于 2016-11-29 11:10:37 | 只看该作者
xandy 发表于 2016-11-29 11:03
抓取超时,可以看看这篇帖子
《Timeout to loud the page/抓取失败(超时),抓取规则不合适或者超时时间设 ...

如图:

是不是表示我的下一页选取有问题?
举报 使用道具
地板
xandy 论坛元老 发表于 2016-11-29 11:16:02 | 只看该作者
cs3520 发表于 2016-11-29 11:10
如图:

是不是表示我的下一页选取有问题?

重新加载规则分析的话,先不勾选内容定位,点击“累计评论”,切换到有评论的页面。然后再勾上内容定位进行后续分析
举报 使用道具
5#
xandy 论坛元老 发表于 2016-11-29 11:16:50 | 只看该作者
cs3520 发表于 2016-11-29 11:10
如图:

是不是表示我的下一页选取有问题?

我测试你的规则,是可以正常翻页的
举报 使用道具
6#
cs3520 初级会员 发表于 2016-11-29 12:02:40 | 只看该作者
xandy 发表于 2016-11-29 11:16
我测试你的规则,是可以正常翻页的

还是出现了开头的问题我的数据如下:

爬虫路线取值变成了-1

举报 使用道具
7#
xandy 论坛元老 发表于 2016-11-29 12:03:57 | 只看该作者
cs3520 发表于 2016-11-29 12:02
还是出现了开头的问题我的数据如下:

爬虫路线取值变成了-1

那就对着错误重新调整下规则
举报 使用道具
8#
cs3520 初级会员 发表于 2016-11-29 12:11:29 | 只看该作者
xandy 发表于 2016-11-29 12:03
那就对着错误重新调整下规则

#text的值为:下一页>>
设置方式为:

请问有什么问题吗?
举报 使用道具
9#
shenzhenwan10 金牌会员 发表于 2016-11-29 12:50:15 | 只看该作者
再做一个定位映射

举报 使用道具
10#
cs3520 初级会员 发表于 2016-11-29 14:17:36 | 只看该作者
xandy 发表于 2016-11-29 12:03
那就对着错误重新调整下规则

我的定位映射一直都是做过的,用的DIV ,class值为rate-pagitor

举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-25 04:47