本帖最后由 zhuohui1987 于 2016-12-13 09:32 编辑

主题:东莞网上房地产_2

问题:
       能获取到信息,但是就是无法定位节点,但是网页变得得不一样的啊
举报 使用道具
| 回复

共 9 个关于本帖的回复 最后回复于 2016-12-13 16:16

沙发
zhuohui1987 金牌会员 发表于 2016-12-13 00:42:10 | 只看该作者
http://housing.gzcc.gov.cn/search/project/sellFormDetail.jsp?unitID=989473
问题:如何关键里面字段长端不一,一个格子好几个src那我要怎么弄这个图片,采集图片和把他替换成数字呢

假如:做样例复制映射,把图片的src按照从左到右的顺序采集下来,导入到excel中,用个函数把数字恢复出来,src text  src  2.2       这个点怎么办

最好帮我用定义自定义xpath一下,谢谢

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
板凳
HJLing 版主 发表于 2016-12-13 10:02:52 | 只看该作者

把这个td的网页片段采集下来 再去excel替换 每个数字的图片名称不同

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
地板
HJLing 版主 发表于 2016-12-13 10:06:27 | 只看该作者
连续动作的xpath不唯一 找到6个节点 你要点哪里
举报 使用道具
5#
zhuohui1987 金牌会员 发表于 2016-12-13 10:13:46 | 只看该作者
HJLing 发表于 2016-12-13 10:06
连续动作的xpath不唯一 找到6个节点 你要点哪里

图片加文本信息,你看一下红色带框的位置。   还是有小点(。)
举报 使用道具
6#
zhuohui1987 金牌会员 发表于 2016-12-13 10:14:02 | 只看该作者
HJLing 发表于 2016-12-13 10:02
把这个td的网页片段采集下来 再去excel替换 每个数字的图片名称不同

东莞网上房地产_2  这个也帮我看一下
举报 使用道具
7#
HJLing 版主 发表于 2016-12-13 10:20:42 | 只看该作者
zhuohui1987 发表于 2016-12-13 10:13
图片加文本信息,你看一下红色带框的位置。   还是有小点(。)


本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
8#
HJLing 版主 发表于 2016-12-13 10:22:44 | 只看该作者
zhuohui1987 发表于 2016-12-13 10:14
东莞网上房地产_2  这个也帮我看一下

这个不是回复了吗 你是希望点哪里

举报 使用道具
9#
zhuohui1987 金牌会员 发表于 2016-12-13 10:28:13 | 只看该作者
HJLing 发表于 2016-12-13 10:22
这个不是回复了吗 你是希望点哪里


http://housing.gzcc.gov.cn/searc ... l.jsp?unitID=989473   



主题:东莞网上房地产_1    和东莞网上房地产_2

网址和主题  不用问题,不同的网址分开的




举报 使用道具
10#
Fuller 管理员 发表于 2016-12-13 16:16:26 | 只看该作者
zhuohui1987 发表于 2016-12-13 10:28
http://housing.gzcc.gov.cn/search/project/sellFormDetail.jsp?unitID=989473   

网址想怎样分开?
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 在网页片段内直观标注——以B站评论采集为
  • 利用AI阅读和分析文本:使用COZE建设游记文
  • 使用AI工具Kimi生成python代码为文本分析结
  • 苹果mac电脑安装集搜客网络爬虫软件失败的
  • 下载支持win7的集搜客网络爬虫软件

热门用户

GMT+8, 2024-9-21 09:23