层级抓取后,第二级网页只抓到一条内容,第一级网址是全的,是怎么回事啊?

看了下两级规则是连起来的,主题命名也没错,求解?


举报 使用道具
| 回复

共 7 个关于本帖的回复 最后回复于 2018-3-2 09:34

沙发
Fuller 管理员 发表于 2018-2-27 23:27:28 | 只看该作者
抓取第二级的时候,点击“单搜”按钮,会问你输入线索数,你是不是只输入了1?

具体要输入多少,可以使用统计功能先统计一下。具体参看:http://www.gooseeker.com/doc/thread-667-1-1.html
举报 使用道具
板凳
Eating66 新手上路 发表于 2018-2-28 18:24:09 | 只看该作者
Fuller 发表于 2018-2-27 23:27
抓取第二级的时候,点击“单搜”按钮,会问你输入线索数,你是不是只输入了1?

具体要输入多少,可以使用 ...

这个问题解决了。我第二次采集的时候没有激活所有数据。
又有一个问题,我设置了翻页规则,但只爬下来两页,是怎么回事?
举报 使用道具
地板
maomao 论坛元老 发表于 2018-2-28 23:41:23 | 只看该作者

应该用这个>号做定位标志,而不是那个网址,那个网址到下一页就变了
举报 使用道具
5#
Eating66 新手上路 发表于 2018-3-1 17:58:00 | 只看该作者
maomao 发表于 2018-2-28 23:41
应该用这个>号做定位标志,而不是那个网址,那个网址到下一页就变了

请问我输入了打印1000条为什么统计线索里只有210条?

举报 使用道具
6#
Fuller 管理员 发表于 2018-3-1 18:28:59 | 只看该作者
Eating66 发表于 2018-3-1 17:58
请问我输入了打印1000条为什么统计线索里只有210条?

如果实际上只有210条,那么你即使输入了1000条,DS打数机也是只采集210条。你可以先统计一下有多少条
举报 使用道具
7#
Eating66 新手上路 发表于 2018-3-2 00:13:59 | 只看该作者
Fuller 发表于 2018-3-1 18:28
如果实际上只有210条,那么你即使输入了1000条,DS打数机也是只采集210条。你可以先统计一下有多少条
...

麻烦管理员帮我看下为什么总是匹配出错,规则名是 雨果2,要怎么改?
举报 使用道具
8#
数据集 高级会员 发表于 2018-3-2 09:34:25 | 只看该作者
Eating66 发表于 2018-3-2 00:13
麻烦管理员帮我看下为什么总是匹配出错,规则名是 雨果2,要怎么改?

你的规则是没有问题的,匹配失败的原因可能是因为详情页面有多种页面结构,用规则加载采集失败的页面分析页面结构哪里不一样导致出错,再修改规则去适应。参考《怎样解决规则采集失败/遗漏的问题?》
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-4 17:47