5 12012

新手求教一个超白的问题

jv811219 于 2016-3-16 20:48 发表 [复制链接]
打开网页就是按图片中的周收益进行排序,但我希望按照总收益率进行排序,然后抓取,请教该用什么线索?多谢!
新图片.jpg
举报 使用道具
| 回复

共 5 个关于本帖的回复 最后回复于 2016-3-21 19:45

Fuller 管理员 发表于 2016-3-16 21:46:32 | 显示全部楼层
做一次模拟点击,点击“总收益排名”那个标签,然后再抓取,跟这个过程一样:http://www.gooseeker.com/doc/article-150-1.html
举报 使用道具
jv811219 初级会员 发表于 2016-3-17 19:33:11 | 显示全部楼层
Fuller 发表于 2016-3-16 21:46
做一次模拟点击,点击“总收益排名”那个标签,然后再抓取,跟这个过程一样:http://www.gooseeker.com/doc ...

多谢指导!再请教一个问题,如果需要同时用到模拟点击,然后翻页,然后下一层网页采集。这种情况下是不是要用三层规则?
举报 使用道具
Fuller 管理员 发表于 2016-3-17 21:24:04 | 显示全部楼层
jv811219 发表于 2016-3-17 19:33
多谢指导!再请教一个问题,如果需要同时用到模拟点击,然后翻页,然后下一层网页采集。这种情况下是不是 ...

是的,要三层,模拟点击-〉翻页,这两级都要设置连贯抓取,下层就是独立的抓取,可以在另一个DS窗口运行。

前两级做好以后,执行抓取,如果DS打数机感觉有异常,应该联系我们,因为现在这个版本有bug,这个bug已经修改了,但是最新版本还没有发布,如有必要,可以先用我们的最新测试版
举报 使用道具
jv811219 初级会员 发表于 2016-3-17 23:27:58 | 显示全部楼层
Fuller 发表于 2016-3-17 21:24
是的,要三层,模拟点击-〉翻页,这两级都要设置连贯抓取,下层就是独立的抓取,可以在另一个DS窗口运行 ...

做好了,三层规则。
但是很奇怪,之前几次运行都有问题,感觉像是第一层规则的模拟点击没起作用,后来又莫名其妙的良好运行了。
不管怎么说,已经运行正常了。多谢!
举报 使用道具
jv811219 初级会员 发表于 2016-3-21 19:45:08 | 显示全部楼层
Fuller 发表于 2016-3-17 21:24
是的,要三层,模拟点击-〉翻页,这两级都要设置连贯抓取,下层就是独立的抓取,可以在另一个DS窗口运行 ...

请教版大一个问题,我要抓得这个网页一共有1000多个数据,但是我每次只想抓前面100个数据。现在的问题是,我前一次抓了100个数据,下次再抓的时候,机器会延续上一次抓完的地方继续往后面抓,而不是抓的前100。这个怎么破解?
谢谢!
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-3-29 16:41