http://member.rapnet.com/RapNet/
采集这个网站,进行相应的匹配规则设定,测试能成功,但是最后进行爬数据时总是会出现匹配失败,采集完成后没有xml的结果显示在本地的DataScraperWorks文件里,求大神指教??
举报 使用道具
| 回复

共 7 个关于本帖的回复 最后回复于 2017-2-7 13:16

沙发
HJLing 版主 发表于 2017-2-7 09:38:16 | 只看该作者
把你写好的主题名也附上
举报 使用道具
板凳
xlt148107 初级会员 发表于 2017-2-7 09:40:55 | 只看该作者
HJLing 发表于 2017-2-7 09:38
把你写好的主题名也附上

主题名xlt1
举报 使用道具
地板
HJLing 版主 发表于 2017-2-7 09:47:26 | 只看该作者

这个网站需要登录没法测试规则
你把匹配失败的规则编号再拿去MS谋数台加载
根据报错内容修改规则
参考教程《怎样解决规则采集失败/遗漏的问题?

举报 使用道具
5#
xlt148107 初级会员 发表于 2017-2-7 09:53:46 | 只看该作者
HJLing 发表于 2017-2-7 09:47
这个网站需要登录没法测试规则
你把匹配失败的规则编号再拿去MS谋数台加载
根据报错内容修改规则

好的,我试试,谢谢哈!
举报 使用道具
6#
xlt148107 初级会员 发表于 2017-2-7 09:57:44 | 只看该作者
xlt148107 发表于 2017-2-7 09:53
好的,我试试,谢谢哈!


举报 使用道具
7#
xlt148107 初级会员 发表于 2017-2-7 09:58:16 | 只看该作者
HJLing 发表于 2017-2-7 09:47
这个网站需要登录没法测试规则
你把匹配失败的规则编号再拿去MS谋数台加载
根据报错内容修改规则

我查看了一下,这个是超时错误,我把超时时间设置长一点就能得到xml结果,可能是国外网站,比较慢的原因!谢谢你的帮助..
举报 使用道具
8#
Fuller 管理员 发表于 2017-2-7 13:16:47 | 只看该作者
xlt148107 发表于 2017-2-7 09:58
我查看了一下,这个是超时错误,我把超时时间设置长一点就能得到xml结果,可能是国外网站,比较慢的原因 ...

超时时间缺省设置是60秒,轻易不要改小,抓取速度跟超时时间无关,不要改太小
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-6-2 22:38