采集规则名称:订单价格采集
网页:IFRAME 网页
单个采集   定位正确 采集内容正确    样例复制后   定位被改变     

2.jpg
1.jpg

商家营销中心.zip

46.05 KB, 下载次数: 0

举报 使用道具
| 回复

共 9 个关于本帖的回复 最后回复于 2020-6-30 09:31

ykmbllw 初级会员 发表于 2020-6-29 09:49:53 | 显示全部楼层
图1   为要采集的数据    图2   为  使用样例复制后的 数值    价格被改变了
举报 使用道具
ykmbllw 初级会员 发表于 2020-6-29 10:36:43 | 显示全部楼层
目前明白的是   第一个TR里面  是有  10个数据     第二个是只有8个数据   样例复制   同个父节点里面子节点 数据量不对   所以导致样例复制不对
举报 使用道具
内容分析应用 金牌会员 发表于 2020-6-29 11:34:09 | 显示全部楼层
技术人员正在加载分析你这个问题
举报 使用道具
内容分析应用 金牌会员 发表于 2020-6-29 11:38:59 | 显示全部楼层
2020-06-29-01.png

你规则的那个样本页面, 加载不出来



举报 使用道具
Fuller 管理员 发表于 2020-6-29 11:43:53 | 显示全部楼层
如果不用做样例复制也能采集到数据,那是因为爬虫自动选择了定位标志,那就不用做样例复制。

如果采集到的内容混乱了,那是网页上自动选用的定位标志不合适,可以看这个教程:https://www.gooseeker.com/doc/article-232-1.html

关于定位标志的更多讨论在这里:https://www.gooseeker.com/doc/thread-707-1-1.html

你这个网页普通用户看不了,我诊断不了规则,只能根据你的截图来推断。
举报 使用道具
ykmbllw 初级会员 发表于 2020-6-30 09:02:26 | 显示全部楼层
Fuller 发表于 2020-6-29 11:43
如果不用做样例复制也能采集到数据,那是因为爬虫自动选择了定位标志,那就不用做样例复制。

如果采集到的 ...

已经将网页保存在 附件中

举报 使用道具
ykmbllw 初级会员 发表于 2020-6-30 09:06:10 | 显示全部楼层
内容分析应用 发表于 2020-6-29 11:38
你规则的那个样本页面, 加载不出来

网页已经保存本地   上传到附近中

举报 使用道具
内容分析应用 金牌会员 发表于 2020-6-30 09:15:02 | 显示全部楼层
没有看到你上传的附件
举报 使用道具
内容分析应用 金牌会员 发表于 2020-6-30 09:31:24 | 显示全部楼层
ykmbllw 发表于 2020-6-30 09:06
网页已经保存本地   上传到附近中

你可以加入集搜客的技术支持群, 把文件发给管理员。
可以直接访问集搜客官网首页, 点击页面右侧的“交流群”。



举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-3-29 16:41