https://www.gooseeker.com/doc/forum.php?mod=post&action=newthread&fid=54
爬取这个地址,某类商品列表,为什么京东的商品价格爬不下来,只有第一个测试时可以,
<jdbook>
        <item>
                <书名>疯传:让你的产品、思想、行为像病毒一样入侵(樊登博士力荐)</书名>
                <评价数量>5.4万+</评价数量>
                <价格>45.60</价格>
                <卖家>电子工业出版社</卖家>
                <出版信息>[美] 乔纳·伯杰(Jonah Berger) 著 | 电子工业出版社 | 2014-01</出版信息>
        </item>
        <item>
                <书名>流量池</书名>
                <评价数量>13万+</评价数量>
                <价格/>
                <卖家>中信出版社</卖家>
                <出版信息>杨飞 著 | 中信出版社,中信出版集团 | 2018-06</出版信息>
        </item>
        <item>

第2个以后的都是<价格/>  .... ,   我定位用的是:偏好class,而且后续操作翻页采集也没问题,所有数据都是<价格/>爬不下来
举报 使用道具
| 回复

共 3 个关于本帖的回复 最后回复于 2021-9-6 16:49

来自 4#
wangyong 版主 发表于 2021-9-6 16:49:53 | 只看该作者
集搜客数据管家快捷采集可以直接采集知乎专栏文章的评论数据,使用步骤如下:
1,安装集搜客数据管家,从左侧工具条进入快捷采集

提示:在开始采集需要之前需要先在数据管家中登录知乎,只有登录后才能采集到全部数据
登录完成后,在知乎_专栏文章评论采中输入要采集的文章链接,点击“获取数据”按钮
2,在快捷采集管理中看到任务状态变为“已采集”后,点击打包按钮就可以下载Excel格式的数据了

3,数据展示:



举报 使用道具
沙发
maomao 论坛元老 发表于 2020-3-7 22:21:50 | 只看该作者
加载你的规则看,你已经解决问题了,给价格做了定位标志映射
举报 使用道具
板凳
qauxjp 初级会员 发表于 2020-3-7 22:49:02 | 只看该作者
maomao 发表于 2020-3-7 22:21
加载你的规则看,你已经解决问题了,给价格做了定位标志映射

嗯,谢谢,解决了

举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-26 01:26