我想采集贝壳网上的二手房和租房数据,用集搜客爬虫该怎样操作呢



举报 使用道具
| 回复

共 1 个关于本帖的回复 最后回复于 2021-3-19 12:06

沙发
wangyong 版主 发表于 2021-3-19 12:06:08 | 只看该作者
本帖最后由 wangyong 于 2021-3-19 14:27 编辑

要采集贝壳网的数据可以直接使用集搜客的贝壳网快捷采集,输入要采集的链接就可以自动采集数据。
现在在快捷采集中共包含贝壳网的8个采集入口对应不同的板块,分别是:
1,贝壳二手房采集_列表
2,贝壳二手房采集_详情
3,贝壳租房采集_列表
4,贝壳租房采集_详情
5,贝壳小区采集_列表
6,贝壳小区采集_详情
7,贝壳新楼盘采集_列表
8,贝壳新楼盘采集_详情
以采集深圳二手房数据为例,操作步骤如下:
1,安装集搜客数据管家,从左侧工具条进入快捷采集,选择访问贝壳二手房采集_列表
输入要采集的网址,如深圳二手房列表网址:https://sz.ke.com/ershoufang/

确认提交后数据管家会自动开始采集,采集完成后,我们可以在快捷采集后台中找到该任务下载数据
下载到列表的数据,包括城市、房源名称、房源链接、小区名称、小区链接、房源信息、发布时间、总价、单价。
2,继续采集到二手房的详情数据,将房源链接添加到贝壳二手房采集_详情,添加多条网址可以选择输入多条网址按钮

添加完成后数据管家会自动开始采集,详情任务采集完成后,打包下载就可以看到具体的二手房数据了
这是采集到的数据


举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-20 17:08