有没有技术在,帮忙看一下一个规则,家乐福_,页面现在有个问题就是价格不是一起显示出来,是延时显示出来,我在取数里设置了延时600秒,但是依然在价格显示出来之前就完成抓取,请帮个忙看一下,谢谢。
举报 使用道具
| 回复

共 5 个关于本帖的回复 最后回复于 2017-10-31 20:16

沙发
umsung 高级会员 发表于 2017-10-31 18:33:35 | 只看该作者
网页加载信息慢就需要把爬虫的速度调慢一些,
1,把滚屏速度调慢一些,滚屏调慢有利于页面加载数据。
2,超时时长调大了,延迟抓取也要调大,大到能显示出价格为止。
3,不要勾选定时器触发。
举报 使用道具
板凳
minelly 中级会员 发表于 2017-10-31 18:36:00 | 只看该作者
好,我试试,谢谢
举报 使用道具
地板
minelly 中级会员 发表于 2017-10-31 18:49:01 | 只看该作者
我试了把超时时长设为100000s,滚屏设为1,还是有一些价格没有显示出来,有没有等所有价格都显示出来之后才开始抓取的方法
举报 使用道具
5#
shenzhenwan10 金牌会员 发表于 2017-10-31 20:14:15 | 只看该作者
你的规则是不是抓取的是需要登录的后台页面, 管理员尝试加载你的规则, 无法访问样本页面
举报 使用道具
6#
shenzhenwan10 金牌会员 发表于 2017-10-31 20:16:21 | 只看该作者
由于无法测试你的规则, 这里只能给出参数的建议值区间
超时时长可以设置成: 60--600 之间
延时抓取可以设置为 5--30 之间
滚屏次数可以设置成 2--20 之间
另外价格勾上"关键内容"
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-26 22:37