微信截图_20160328154810.jpg
之前的都正常。下楼收个快递回来结果就停在1700页再也不动了……
这种情况怎么办?重新采集的话也太耗费时间了。
举报 使用道具
| 回复

共 8 个关于本帖的回复 最后回复于 2016-3-28 22:23

Fuller 管理员 发表于 2016-3-28 17:07:15 | 显示全部楼层
这是哪个版本?DS打数机菜单 帮助-》关于 ,可以看版本。

很可能遇到了什么异常信息,最好告诉我软件版本,还有就是能把 metaseeker.log.txt 日志文件发过来最好,邮箱是 info@gooseeker.com

如果翻页到1700页,那么需要研究一下这个网站的每个分页是否有独立网址,如果有,那么可以从1700页接上
举报 使用道具
Fuller 管理员 发表于 2016-3-28 17:09:30 | 显示全部楼层
我看了这个规则,页面是:
  1. http://www.dayinhu.com/list/latest?page=3
复制代码

后面参数就是页码,那么你构造

  1. http://www.dayinhu.com/list/latest?page=1700
复制代码
添加线索,填进去,再重新运行打数机,就会从1700开始了
举报 使用道具
redwindy 中级会员 发表于 2016-3-28 17:16:05 | 显示全部楼层
Fuller 发表于 2016-3-28 17:09
我看了这个规则,页面是:
后面参数就是页码,那么你构造

我找到问题所在了。不过目前只是猜想。求证实。 微信截图_20160328154810.jpg
可能是这里的问题!
他这个页面每页10条数据。
1717停下来的话,抛出没有采集到的,那么应该是满了。
不过超出170条才停……难道170条都没采集到么?
这个位置可以自己随便改吗?
举报 使用道具
redwindy 中级会员 发表于 2016-3-28 17:30:00 | 显示全部楼层
Fuller 发表于 2016-3-28 17:07
这是哪个版本?DS打数机菜单 帮助-》关于 ,可以看版本。

很可能遇到了什么异常信息,最好告诉我软件版本 ...

微信截图_20160328154810.jpg
版本在这里。

举报 使用道具
Fuller 管理员 发表于 2016-3-28 17:37:53 | 显示全部楼层
redwindy 发表于 2016-3-28 17:16
我找到问题所在了。不过目前只是猜想。求证实。
可能是这里的问题!
他这个页面每页10条数据。

这个位置可以随便改,应该不是这个问题。如果满了,会在这个文件夹中创建一个子文件夹,名字是 m,新内容会放在m中。而且一页生成一个文件,那么1717页就是1717个文件,还没有满。
要么就是程序问题,遇到特殊图片,采集不下来。如果要彻底找到原因,需要把 metaseeker.log.txt发给我们。这个文件位于 .metaseeker文件夹。如果你登录windows的账号是work,那么就在c:\Users\work\.metaseeker 中
举报 使用道具
redwindy 中级会员 发表于 2016-3-28 17:54:34 | 显示全部楼层
Fuller 发表于 2016-3-28 17:37
这个位置可以随便改,应该不是这个问题。如果满了,会在这个文件夹中创建一个子文件夹,名字是 m,新内容 ...

已发送,求指导。
举报 使用道具
Fuller 管理员 发表于 2016-3-28 19:21:15 | 显示全部楼层
redwindy 发表于 2016-3-28 17:54
已发送,求指导。

已收到,但是分析代码需要一些时间。眼前主要解决
1,按照我上一楼说的方法,从1717页接上采集
2,建议下载和更新到V5.7.0版本,我记得下载图片的问题应该已经解决了
举报 使用道具
redwindy 中级会员 发表于 2016-3-28 22:23:34 | 显示全部楼层
Fuller 发表于 2016-3-28 19:21
已收到,但是分析代码需要一些时间。眼前主要解决
1,按照我上一楼说的方法,从1717页接上采集
2,建议下 ...

十分感谢!难得这么耐心细致!
我先试试看。有问题继续沟通交流。
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-3-28 23:52