规则“农药-搜索结果1”
重新加载时有如下提示,




加载抓取规则遇到的错误:
无法定位容器 No.0
无法定位抓取内容 No.3 (情景2);XPath是../text()

加载爬虫路线遇到的错误:
无法定位网页内容(情形2),基于XPath://*[@class='pagination']/ul/li[position()=12]/a[.//text()="下一页 »"]
无法定位线索1;定位用XPath:<context>//*[@id='iframepage']</context><context>//*[@class='pagination']/ul/li[position()=12]/a[.//text()="下一页 »"]</context>。跳过!
无法定位网页内容(情形2),基于XPath://*[@class='pagination']/ul/li[position()=12]/a[.//text()="下一页 »"]
无法定位记号
经检查,记号(下一页 »)不符合要求,原因:节点号不正确

举报 使用道具
| 回复

共 18 个关于本帖的回复 最后回复于 2017-3-31 10:39

沙发
Fuller 管理员 发表于 2017-3-30 17:34:04 | 只看该作者
你这个规则定义的时候,一定是做了查询以后才定义的,那时候,网页上有内容,所以你定义了一个规则,还有翻页。

再次加载的时候,你还没有做查询,什么内容都没有,所以,提示你“后续分析”,也就是说等你做了查询以后,再做后续分析。

这个网页是怎样查询的?我无法测试
举报 使用道具
板凳
Fuller 管理员 发表于 2017-3-30 17:38:50 | 只看该作者

我做了查询以后,再后续分析,就正确了。

那么就有个问题了:运行的时候,你是否做了一个规则,让DS打数机先做查询操作?

也就是说,这个主题之前应该有个主题,做一些动作,比如,输入查询条件并且点击查询按钮,这是高级教程的连续动作部分讲解的内容。
举报 使用道具
地板
快乐少年郎 初级会员 发表于 2017-3-30 17:40:31 | 只看该作者
本帖最后由 快乐少年郎 于 2017-3-30 17:46 编辑

是的
举报 使用道具
5#
快乐少年郎 初级会员 发表于 2017-3-30 17:45:44 | 只看该作者
Fuller 发表于 2017-3-30 17:38
我做了查询以后,再后续分析,就正确了。

那么就有个问题了:运行的时候,你是否做了一个规则,让DS打数 ...

前面还有个规则 就是 输入查询条件并且点击查询按钮 ,参照  怎样抓取中国知网数据 第一个规则做的。
举报 使用道具
6#
Fuller 管理员 发表于 2017-3-30 17:59:47 | 只看该作者
快乐少年郎 发表于 2017-3-30 17:45
前面还有个规则 就是 输入查询条件并且点击查询按钮 ,参照  怎样抓取中国知网数据 第一个规则做的。
...

DS打数机要从第一个开始运行。

加载第二个的方法按照我说的做,是否加载成功了?
举报 使用道具
7#
快乐少年郎 初级会员 发表于 2017-3-30 18:11:58 | 只看该作者
本帖最后由 快乐少年郎 于 2017-3-30 18:16 编辑
Fuller 发表于 2017-3-30 17:59
DS打数机要从第一个开始运行。

加载第二个的方法按照我说的做,是否加载成功了?

是的,加载成功。
然后,刚才我从第一个规则开始执行了下,抓取窗口状态面板提示:连续动作开始,紧接着就是"验证规则,匹配失败",是否说明第二个规则还是有错误?
举报 使用道具
8#
Fuller 管理员 发表于 2017-3-30 18:49:35 | 只看该作者
快乐少年郎 发表于 2017-3-30 18:11
是的,加载成功。
然后,刚才我从第一个规则开始执行了下,抓取窗口状态面板提示:连续动作开始,紧接着就 ...

你看到输入查询条件并且查到内容了没有?

第一级的主题名是什么?
举报 使用道具
9#
快乐少年郎 初级会员 发表于 2017-3-30 19:08:36 | 只看该作者
Fuller 发表于 2017-3-30 18:49
你看到输入查询条件并且查到内容了没有?

第一级的主题名是什么?

第一级规则:农药-企业数据-搜索1
(第二级规则:农药-输入搜索词1)

可以看见输入查询条件了,但没有查询到内容。


举报 使用道具
10#
Fuller 管理员 发表于 2017-3-30 21:10:01 | 只看该作者
快乐少年郎 发表于 2017-3-30 19:08
第一级规则:农药-企业数据-搜索1
(第二级规则:农药-输入搜索词1)

我加载了你的规则,运行的很好。会不会是你的网速太慢?那么就在第一级,每个动作增加额外延时,比如,3秒
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-3 03:22