我想采集贝壳网上的二手房和租房数据,用集搜客爬虫该怎样操作呢



本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
| 回复

共 1 个关于本帖的回复 最后回复于 2021-3-19 12:06

沙发
wangyong 版主 发表于 2021-3-19 12:06:08 | 只看该作者
本帖最后由 wangyong 于 2021-3-19 14:27 编辑

要采集贝壳网的数据可以直接使用集搜客的贝壳网快捷采集,输入要采集的链接就可以自动采集数据。
现在在快捷采集中共包含贝壳网的8个采集入口对应不同的板块,分别是:
1,贝壳二手房采集_列表
2,贝壳二手房采集_详情
3,贝壳租房采集_列表
4,贝壳租房采集_详情
5,贝壳小区采集_列表
6,贝壳小区采集_详情
7,贝壳新楼盘采集_列表
8,贝壳新楼盘采集_详情
以采集深圳二手房数据为例,操作步骤如下:
1,安装集搜客数据管家,从左侧工具条进入快捷采集,选择访问贝壳二手房采集_列表
输入要采集的网址,如深圳二手房列表网址:https://sz.ke.com/ershoufang/

确认提交后数据管家会自动开始采集,采集完成后,我们可以在快捷采集后台中找到该任务下载数据
下载到列表的数据,包括城市、房源名称、房源链接、小区名称、小区链接、房源信息、发布时间、总价、单价。
2,继续采集到二手房的详情数据,将房源链接添加到贝壳二手房采集_详情,添加多条网址可以选择输入多条网址按钮

添加完成后数据管家会自动开始采集,详情任务采集完成后,打包下载就可以看到具体的二手房数据了
这是采集到的数据


本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 话题分析(NMF模型和LDA模型)软件的安装和
  • 运行Apple无法验证的程序的方法
  • 文本聚类分析软件的安装和使用方法
  • 利用AI阅读和分析文本:扣子COZE记录用户反
  • 在网页片段内直观标注——以B站评论采集为

热门用户

GMT+8, 2025-2-6 22:21