本帖最后由 lucky半杯 于 2017-4-17 11:44 编辑

网址:https://shopsearch.taobao.com/se ... _type=&ratesum=
每将鼠标移到该地方,出现我要的信息,如描述相符4.81。但是在MS数台上,每点击一次不同店铺的4.81,都会弹出要我刷新网页结构。如果不刷新就采集不到


ZGV(%BRQ2K}LKZZCY)E@X1A.png (291.31 KB, 下载次数: 867)

ZGV(%BRQ2K}LKZZCY)E@X1A.png

@IBRBS6Q8EA{~86OZNL(MZL.png (13.87 KB, 下载次数: 843)

@IBRBS6Q8EA{~86OZNL(MZL.png
举报 使用道具
| 回复

共 24 个关于本帖的回复 最后回复于 2017-4-18 18:43

沙发
lucky半杯 中级会员 发表于 2017-4-17 11:54:21 | 只看该作者
还有那个皇冠图标,采集他的class值,为20,但是其他产品也只能是采集到20的,2个皇冠之类的就采集不到
举报 使用道具
板凳
Fuller 管理员 发表于 2017-4-17 12:28:03 | 只看该作者
lucky半杯 发表于 2017-4-17 11:54
还有那个皇冠图标,采集他的class值,为20,但是其他产品也只能是采集到20的,2个皇冠之类的就采集不到 ...

你的规则名是什么?我直接针对你的规则做诊断就更有效一些
举报 使用道具
地板
lucky半杯 中级会员 发表于 2017-4-17 12:59:36 | 只看该作者
Fuller 发表于 2017-4-17 12:28
你的规则名是什么?我直接针对你的规则做诊断就更有效一些

文具店铺
举报 使用道具
5#
lucky半杯 中级会员 发表于 2017-4-17 14:39:21 | 只看该作者
Fuller 发表于 2017-4-17 12:28
你的规则名是什么?我直接针对你的规则做诊断就更有效一些

看了吗是不是要写XPATH

举报 使用道具
6#
lucky半杯 中级会员 发表于 2017-4-17 14:39:43 | 只看该作者
Fuller 发表于 2017-4-17 12:28
你的规则名是什么?我直接针对你的规则做诊断就更有效一些

你好,能帮忙看下嘛

举报 使用道具
7#
Fuller 管理员 发表于 2017-4-17 15:00:20 | 只看该作者
lucky半杯 发表于 2017-4-17 14:39
你好,能帮忙看下嘛

信用 那里,DOM上能看到那个a节点的class='rank seller-rank-20',这个数字一定是跟级别有关,所以,在生成的规则中如果含有这个数字,就没有通用性。点击“测试”按钮,再点击数据规则,能看到他的规则。入下图



可以用自定义xpath
  1. .//*[contains(@class,'rank seller-rank')]/@class
复制代码






举报 使用道具
8#
lucky半杯 中级会员 发表于 2017-4-17 15:07:28 | 只看该作者
Fuller 发表于 2017-4-17 15:00
信用 那里,DOM上能看到那个a节点的class='rank seller-rank-20',这个数字一定是跟级别有关,所以,在生 ...

感谢,盯着  屏幕刷新到现在,以后回了,谢了

举报 使用道具
9#
Fuller 管理员 发表于 2017-4-17 15:42:58 | 只看该作者
lucky半杯 发表于 2017-4-17 15:07
感谢,盯着  屏幕刷新到现在,以后回了,谢了

如果是点击或者悬浮才能出现的内容,需要定义连续动作,而且要两级规则,第一级是动作前的,第二级是动作后的,这里有个悬浮动作的教程《采集悬浮窗信息——已微博为例
举报 使用道具
10#
lucky半杯 中级会员 发表于 2017-4-17 18:57:27 | 只看该作者
Fuller 发表于 2017-4-17 15:42
如果是点击或者悬浮才能出现的内容,需要定义连续动作,而且要两级规则,第一级是动作前的,第二级是动作 ...

我觉得第一步做规则,需要设置样例复制,不然一页只能抓第一个,我的就是这样

举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-27 19:50