规则叫:李宁1
一共有80多页,但最多也就采集了25页,之后再采集,往往只能采集2页了,很奇怪?!
举报 使用道具
| 回复

共 6 个关于本帖的回复 最后回复于 2016-7-16 08:49

沙发
Alexisheee 初级会员 发表于 2016-7-14 12:19:06 | 只看该作者
对了  我按照我能找到的帖子所建议:清理了cookies
设置了采集次数
但只能翻2页....
举报 使用道具
板凳
shenzhenwan10 金牌会员 发表于 2016-7-14 12:22:13 | 只看该作者
有的网站有翻页限制,超过一定页数后就显示相同内容
你可以在浏览器上人工翻页查看,看翻到几十页后内容是不是不变化了
举报 使用道具
地板
Alexisheee 初级会员 发表于 2016-7-14 12:28:58 | 只看该作者
shenzhenwan10 发表于 2016-7-14 12:22
有的网站有翻页限制,超过一定页数后就显示相同内容
你可以在浏览器上人工翻页查看,看翻到几十页后内容是 ...

是采集的天猫商城评论;我翻页了,规则没有变化
举报 使用道具
5#
ym 版主 发表于 2016-7-14 14:31:11 | 只看该作者
Alexisheee 发表于 2016-7-14 12:28
是采集的天猫商城评论;我翻页了,规则没有变化

你设置的采集次数是指哪个?截图看看
举报 使用道具
6#
Alexisheee 初级会员 发表于 2016-7-15 18:51:07 | 只看该作者
ym 发表于 2016-7-14 14:31
你设置的采集次数是指哪个?截图看看

说错了,是滚屏参数,一个是3,一个是-1.是因为没有设置定位选项为偏好class么?
举报 使用道具
7#
Fuller 管理员 发表于 2016-7-16 08:49:48 | 只看该作者
滚屏是指当前网页上,自动地滚动右边的滚动条,网址不变
翻页是指点击“下一页”,通常会加载新的网页。

你是翻页还是滚屏?刚才我测试了这个主题,翻页正常。你定义的翻页规则也很正确
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-25 09:14