我新发布了一个采集规则:
企业信息公告_输入查询条件


详细信息:
通过自动输入查询日期,自动点击提交按钮,可以看到查询结果,然后执行抓取。这个抓取规则是第一级,负责输入查询日期和提交按钮。跟这个规则配套的是“企业信息公告_抓取查询结果"。请注意,V5.x版本由于查询条件写在抓取规则里面,影响了使用体验,要查询其它日期,要制作对应的抓取规则。

希望大家喜欢!下载地址:
http://www.gooseeker.com/res/detail_111248.html
举报 使用道具
| 回复

共 2 个关于本帖的回复 最后回复于 2016-3-3 09:26

沙发
shendf 新手上路 发表于 2016-3-3 05:32:45 | 只看该作者
现在用不了?我下载了规则,但样本网页都打不开了。另外请问http://gsxt.saic.gov.cn/这里面的内容能采集吗
举报 使用道具
板凳
Fuller 管理员 发表于 2016-3-3 09:26:22 | 只看该作者
shendf 发表于 2016-3-3 05:32
现在用不了?我下载了规则,但样本网页都打不开了。另外请问http://gsxt.saic.gov.cn/这里面的内容能采集吗 ...

关于样本页面失效问题,我们来解决,会替换一个新的。

样本页面失效通常不影响抓取规则,你下载下来以后,进入会员中心 -》爬虫管理-》规则管理,找到这个规则,点击进入以后,添加网址,你这个网址的页面如果与规则的结构一样,就能采集
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 利用AI阅读和分析文本:扣子COZE记录用户反
  • 在网页片段内直观标注——以B站评论采集为
  • 利用AI阅读和分析文本:使用COZE建设游记文
  • 使用AI工具Kimi生成python代码为文本分析结
  • 苹果mac电脑安装集搜客网络爬虫软件失败的

热门用户

GMT+8, 2024-11-25 16:02