本帖最后由 yangwenge 于 2017-11-27 14:48 编辑

【启动采集前的配置】
  • 预先登陆网站:否
  • 配置打码平台:否

【运行方法】— 详见数据DIY图文教程

  • 用GS爬虫浏览器或者是安装了爬虫软件的火狐浏览器访问58同城二手房详情页面;
  • 输入一个或多个58同城二手房详情网址,然后点击“获取数据”;
  • 点击“启动采集”按钮,采集完成后点击“打包”按钮,就可以下载数据了。

举报 使用道具
| 回复

共 4 个关于本帖的回复 最后回复于 2020-10-19 10:07

沙发
sxp19850719 新手上路 发表于 2017-12-5 08:29:57 | 只看该作者
采集状态总是显示已停止,重新采集后还是会显示已停止
举报 使用道具
板凳
yangwenge 金牌会员 发表于 2017-12-5 09:10:58 | 只看该作者
sxp19850719 发表于 2017-12-5 08:29
采集状态总是显示已停止,重新采集后还是会显示已停止

检查下看看,是否是添加的网址和样本页面的网页结构不一样

举报 使用道具
地板
kk1314 新手上路 发表于 2020-10-18 19:15:13 | 只看该作者
样本页面失效
举报 使用道具
5#
Fuller 管理员 发表于 2020-10-19 10:07:58 | 只看该作者

这个是采集二手房详情信息的快捷采集工具,因为房产信息很快会下架,网址很快就失效了,只要按照要求找一个能打开的网址就可以替换老的样本页面。

二手房是一个专门的网站板块,在这个板块中点开一个房产条目,就能进入到详情页,把网址拷贝下来就行。下面截图是二手房列表页,每一条房产信息可以点击进去,这个工具就是采集点击进去的那个网页。


举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 利用AI阅读和分析文本:扣子COZE记录用户反
  • 在网页片段内直观标注——以B站评论采集为
  • 利用AI阅读和分析文本:使用COZE建设游记文
  • 使用AI工具Kimi生成python代码为文本分析结
  • 苹果mac电脑安装集搜客网络爬虫软件失败的

热门用户

GMT+8, 2024-11-18 02:45