https://www.huoqiu.cn/plan/combination.html

这几百页债权,用尽了一切教程和方法,都抓不到。就连版主最新写的BOX都不行。难道是我命犯天煞孤星?
举报 使用道具
| 回复

共 6 个关于本帖的回复 最后回复于 2018-11-21 17:33

沙发
gooseeker_info 金牌会员 发表于 2015-11-3 21:34:31 | 只看该作者
要抓什么内容?针对这个网址,我做了一个抓列表的规则,很容易做,10分钟就能做好,如果符合你的要求,直接下载使用即可:http://www.gooseeker.com/res/detail_96865.html
举报 使用道具
板凳
旅行的意义 初级会员 发表于 2015-11-3 21:53:17 | 只看该作者
这种结构化的页面,用gooseeker抓取是很方便的
举报 使用道具
地板
gooseeker_info 金牌会员 发表于 2015-11-3 22:42:33 | 只看该作者
我有发布了一个抓详情的规则组合:
1,第一级是“火球计划债权组合_看详情”,下载地址:http://www.gooseeker.com/res/detail_96870.html
2,第二级是“火球计划债权组合_详情”,下载地址:http://www.gooseeker.com/res/detail_96872.html

这是一个连续动作组合(请参考手册:http://www.gooseeker.com/doc/article-141-1.html )。第一级把债权列表抓下来,并且自动启动第二级,第二级是一系列连续动作,依次点击每个债券的“查看”详情超链接,把它的详情抓取下来
举报 使用道具
5#
RTNULL 初级会员 发表于 2018-11-19 15:56:48 | 只看该作者
参看高级教程里的《连续动作让爬虫持续采集数据
举报 使用道具
6#
xyxiong007 中级会员 发表于 2018-11-21 15:58:44 | 只看该作者
楼主,为什么这个网页打开就是404了?
举报 使用道具
7#
Fuller 管理员 发表于 2018-11-21 17:33:33 | 只看该作者
很多网页是动态的,估计这个组合已经失效了
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 为什么用微软的excel无法打开xls文件?powe
  • 360或火绒等杀毒软件导致GooSeeker爬虫软件
  • 话题分析(NMF模型和LDA模型)软件的安装和
  • 运行Apple无法验证的程序的方法
  • 文本聚类分析软件的安装和使用方法

热门用户

GMT+8, 2025-7-12 17:49