快捷导航
26 247

求问!!!!

WZXwzx 于 2019-7-9 18:21 发表 [复制链接]
WZXwzx 初级会员 发表于 2019-7-12 10:43:02 | 显示全部楼层
Fuller 发表于 2019-7-12 10:04
我把你的规则拷贝了一份进行测试,都正常

我又重新设置了一个规则“经营管理者11”“经营管理者11检索后”“经营管理者作者详情”试了试
还是没有任何数据

举报 使用道具
Fuller 管理员 发表于 2019-7-12 14:43:36 | 显示全部楼层
WZXwzx 发表于 2019-7-12 10:43
我又重新设置了一个规则“经营管理者11”“经营管理者11检索后”“经营管理者作者详情”试了试
还是没有 ...

我估计是这个原因,刚才我也碰到了。

这个网站的内容是放在一个iframe中的,如果多存几次规则,就会直接显示iframe的内容,而没有显示大网页的内容。

可以这样做:到会员中心,把第一级规则的所有线索都删除,手工添加这个网址:http://kns.cnki.net/kns/brief/result.aspx?dbprefix=CJFQ

另外,DS打数机的菜单 配置-》滚屏参数,把滚屏次数设置成0,这样就不滚屏。

我测试是好的
举报 使用道具
WZXwzx 初级会员 发表于 2019-7-13 13:45:20 | 显示全部楼层
Fuller 发表于 2019-7-12 14:43
我估计是这个原因,刚才我也碰到了。

这个网站的内容是放在一个iframe中的,如果多存几次规则,就会直接 ...

非常感谢!!!!问题已经解决了!!!!

举报 使用道具
WZXwzx 初级会员 发表于 2019-7-13 19:25:52 | 显示全部楼层
WZXwzx 发表于 2019-7-13 13:45
非常感谢!!!!问题已经解决了!!!!

还想求问您!
如果是
标题1       作者1
标题2       作者1
标题3       作者1   作者2
这样的形式,要怎么做嵌套样例复制还能抓取到所有的作者详情呢?
因为第一行只有 一个作者,没法做第二级的小样例复制

举报 使用道具
Fuller 管理员 发表于 2019-7-13 22:37:17 | 显示全部楼层
WZXwzx 发表于 2019-7-13 19:25
还想求问您!
如果是
标题1       作者1

这个很麻烦。只能用第三行作为第一个样例,第四行作为第二个样例。等存了规则以后,点击“测试”按钮,切换到数据规则输出窗口,手工修改规则文件。规则文件中多个样例循环是用一句for-each表示的,把循环的起始位置改成1。点击“保存修改”把修改的规则存起来,这个时候不能点击“存规则”,存规则总是保存自动生成的规则
举报 使用道具
WZXwzx 初级会员 发表于 7 天前 | 显示全部楼层
Fuller 发表于 2019-7-13 22:37
这个很麻烦。只能用第三行作为第一个样例,第四行作为第二个样例。等存了规则以后,点击“测试”按钮,切 ...

我找了一个类似的网页做了一个规则“财经界2检索后”,按照您说的进行了,但是在数据规则里没有找到您说的for-each
举报 使用道具
Fuller 管理员 发表于 7 天前 | 显示全部楼层
WZXwzx 发表于 2019-7-14 01:03
我找了一个类似的网页做了一个规则“财经界2检索后”,按照您说的进行了,但是在数据规则里没有找到您说 ...

不好意思,前面说的不准确。

如果样例复制定义在整理箱的最顶层容器节点上,那么可以看到

循环20190714074402.png

第一个红框里面的position值是起点,>=1表示从1开始;第二个红框里面的表示每间隔多少个采集一个,如果每个都采集,那么这个红框里面的内容没有。上图是每2个采集一个,也就是隔一个采集一个。这两个数字都可以修改。

请注意,要修改两个位置,有红框的那行是调用这个循环规则,而下面那行是定义这个循环规则,要同时修改
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 摘取泉港区政府工作报告中的数字遇到的问题
  • 调度设置参数说明
  • 集搜客网络爬虫软件实现自动网页截屏
  • 怎样使用搜狐新闻搜索列表快捷工具抓取关键
  • 用于清洗文本内容的Excel函数公式

热门用户

集搜客GooSeeker网络爬虫 ( 粤ICP备11065265号-2 )

GMT+8, 2019-7-21 08:41