主题  :珠海预售_*
珠海预售_3点击到里面信息没有数据的啊
珠海预售_4点击到里面信息没有数据的啊
是空数据




举报 使用道具
| 回复

共 22 个关于本帖的回复 最后回复于 2017-3-17 16:51

沙发
xandy 论坛元老 发表于 2017-3-15 15:13:28 | 只看该作者
你应该补充下你的问题,不知道你要问什么
举报 使用道具
板凳
xandy 论坛元老 发表于 2017-3-15 15:17:29 | 只看该作者
本帖最后由 xandy 于 2017-3-15 16:36 编辑

实际上在浏览器直接打开你的目标网址:
  1. http://www.zhzgj.gov.cn/house/Detail_2007.aspx?fId={DCB5B175-C653-42C3-A901-281E1C9287C5}&dongNo=3%E6%A0%8B
复制代码
点击里头的“期房可售”弹出新的网页内容就是空白的,既然是空白的当然是采集不到信息的。
举报 使用道具
地板
zhuohui1987 金牌会员 发表于 2017-3-15 15:41:51 | 只看该作者

举报 使用道具
5#
xandy 论坛元老 发表于 2017-3-15 15:47:28 | 只看该作者

火狐浏览器和GS爬虫浏览器都点击不到,该网站的浏览器兼容问题~
举报 使用道具
6#
Fuller 管理员 发表于 2017-3-15 16:14:41 | 只看该作者
在chrome,edge和火狐下点击都看到的是空白内容
举报 使用道具
7#
zhuohui1987 金牌会员 发表于 2017-3-15 16:34:18 | 只看该作者
Fuller 发表于 2017-3-15 16:14
在chrome,edge和火狐下点击都看到的是空白内容

按照你采集点击出来当然是空白的啊,但是直接使用浏览器点击里面是有东西的啊
举报 使用道具
8#
Fuller 管理员 发表于 2017-3-15 16:45:43 | 只看该作者
zhuohui1987 发表于 2017-3-15 16:34
按照你采集点击出来当然是空白的啊,但是直接使用浏览器点击里面是有东西的啊
...

这个网站要从首页开始一直点进去才能看到内容,从这里: http://www.zhzgj.gov.cn/house/Default.aspx ,不能用层级抓取,看样子这是使用了微软的服务器开发控件,这个操作过程是记录了会话状态的。所以,你要定义多级连续动作。这里还有一个飞掠模式,抓取弹出新窗口中的内容。你是旗舰版就没有问题
举报 使用道具
9#
zhuohui1987 金牌会员 发表于 2017-3-15 17:21:49 | 只看该作者

像这个房号要连续点击要怎么写定位呢
举报 使用道具
10#
zhuohui1987 金牌会员 发表于 2017-3-15 17:25:06 | 只看该作者
zhuohui1987 发表于 2017-3-15 17:21
像这个房号要连续点击要怎么写定位呢

/html/body/form/table[position()=3]/tbody/tr/td/table/tbody/tr/td/table[position()=3]/tbody/tr[position()>=1]/td[position()>=1]/table/tbody/tr/td[position()>=1]/table/tbody/tr/td/a
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-2 16:53