11#
zhu369 新手上路 发表于 2017-9-1 14:07:36 | 只看该作者
评论人和评论时间一个都没采集到吗?你的参数都是怎么设置的?
举报 使用道具
12#
shengchengx 金牌会员 发表于 2017-9-1 14:39:12 | 只看该作者
axu517 发表于 2017-9-1 13:04
网页是完全加载到底部的     我不知道是不是我参数设置问题,但是我都已经设置很大了 还是不行

...

勾选了关键内容了没?
举报 使用道具
13#
axu517 中级会员 发表于 2017-9-1 14:42:03 | 只看该作者
shengchengx 发表于 2017-9-1 14:39
勾选了关键内容了没?

评论人跟评论时间勾选关键内容的话会出现匹配失败,此时我已经把超时设置为3000都是失败的  在用户名或主题名那边勾选关键内容的话可以采集,但是采集结果仍旧是那样,不能把评论人跟评论时间抓取到

举报 使用道具
14#
axu517 中级会员 发表于 2017-9-1 14:47:16 | 只看该作者
zhu369 发表于 2017-9-1 14:07
评论人和评论时间一个都没采集到吗?你的参数都是怎么设置的?

嗯呢 没有采集到,我现在样本网址就没有通过。   参数的话,超时跟延时超过200.300都设置过,滚屏速度一般是-6 -8  有时候负十多以上也试过, 滚屏次数设置在20左右   抓取速度的话之后可以慢慢调,但是现在无论设置多大,都抓取不到   

举报 使用道具
15#
bowieD 金牌会员 发表于 2017-9-1 15:46:50 | 只看该作者
你其他内容都能抓取到,应该不是参数设置的问题,你的规则也是没有问题的,我能采集下来,也没有改动你的规则。你是把所有的数据都采集下来了就是没有评论人和评论时间是吗?改成决定定位试试。
举报 使用道具
16#
axu517 中级会员 发表于 2017-9-1 17:33:30 | 只看该作者
bowieD 发表于 2017-9-1 15:46
你其他内容都能抓取到,应该不是参数设置的问题,你的规则也是没有问题的,我能采集下来,也没有改动你的规 ...

我用的本来就是绝对定位。。。 我私信你 你可否帮我远程看一下

举报 使用道具
17#
bowieD 金牌会员 发表于 2017-9-1 17:51:42 | 只看该作者
检查的点就是那些,再仔细检查一下,重新映射一遍
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-5 04:11