GooSeeker集搜客网络爬虫,简单高效的网页采集器

百度彩票历史数据抓取

336 2 0 所需积分:500 更新时间:2016-09-24 12:22 类别: 其他

规则介绍

这个规则从百度彩票网站抓取PK拾的历史开奖信息。这个规则只抓取当前日期的网页,不翻页。如果想抓取其他日期的开奖信息,自己构造网址即可,比如,http://www.lecai.com/lottery/draw/list/557?d=2012-06-04 是6月4日的开奖信息,那么 http://www.lecai.com/lottery/draw/list/557?d=2012-06-05 就是6月5日的开奖信息。构造好网址以后,在会员中心找到这个规则,添加线索可以成批加入网址 (如果该规则与描述不符或无效,您可 申诉。)

采集内容

信息字段 网页内容
百度彩票
开奖日期
期号
号码1
号码2
号码3
号码4
号码5
号码6
号码7
号码8
号码9
号码10

数据截图

用户评论

关于作者

作者其他资源更多 >

专利检索_搜索结果
这是一组规则中的第二个,第一个规则的名字是“专利检索_自动输入查询条件”,第一个抓取规则自动输入检索条件,会自动过渡到这个规则,所以,本规则一般不直接运行。加载这个规则时请注意,因为样本页面一开始是没有检索结果的,等提示进行后续分析时,先输入检索条件,等看到检索结果再选择“后续分析”菜单。相关教程参看:http://www.gooseeker.com/doc/article-162-1.html
专利检索_自动输入查询条件
这是一组抓取规则的第一个,与它配套的第二个抓取规则是“专利检索_搜索结果”,这个规则作为抓取的入口,能够自动输入检索关键词,利用了GooSeeker V5.4.0版本的连续动作功能,等自动提交以后,就能显示检索结果,由第二个抓取规则把检索结果抓下来。
中国食品农产品认证证书
中国食品农产品认证信息系统网站最大特点是用了很多iframe,嵌套在一起展示证书信息。无论iframe有多少层,集搜客GooSeeker网络爬虫都一视同仁,就像没有iframe一样定义抓取规则。有个详细攻略讲解抓取规则定义过程:http://www.gooseeker.com/doc/article-189-1.html
V8.9 版权所有 © 2007-2016 GooSeeker 深圳市天据电子商务有限公司
粤ICP备11065265号-2 粤公网安备 44030502000239号