|
抓取过程最大的成本是向目标网站发请求,对于第二个需求,无论是在抓取的过程中找到最低和最高,还是在抓取以后整理结果文件的时候找出他们,抓取的数量是一样的,所以成本是一样的。总之,还是想办法把抓取结果导入excel进行排序吧。
第一个需求是翻页过程吗?如果是翻页,那就用连续动作的点击动作,也能翻页,而且可以设定条件
如果要翻100页,那么重复次数填100,最重要的合用表达式,这个XPath表达式的结果应该是个布尔类型,当这个结果是true的时候,那么继续翻页。所以,你编写XPath的时候,表达出来“销量>=5”的时候结果为true,一旦遇到4或者更小数字,就终止了
|
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有帐号?立即注册
x
|
共 1 个关于本帖的回复 最后回复于 2016-9-30 23:23