规则名称:酒店行业  

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
| 回复

共 10 个关于本帖的回复 最后回复于 2019-5-22 15:54

沙发
Fuller 管理员 发表于 2019-5-22 09:47:46 | 只看该作者
这个规则没有删除吧?我怎么搜不到?
举报 使用道具
板凳
z_nang122 新手上路 发表于 2019-5-22 09:49:50 | 只看该作者
Fuller 发表于 2019-5-22 09:47
这个规则没有删除吧?我怎么搜不到?

有的,刚刚我重新做了一个上传了 还是不行
举报 使用道具
地板
Fuller 管理员 发表于 2019-5-22 09:51:32 | 只看该作者
你用的样本网址是什么?加载规则看到的网页看到的是空白的,你把样本网址发出来吧
举报 使用道具
5#
z_nang122 新手上路 发表于 2019-5-22 09:52:23 | 只看该作者
Fuller 发表于 2019-5-22 09:51
你用的样本网址是什么?加载规则看到的网页看到的是空白的,你把样本网址发出来吧 ...

https://hotel.qunar.com/render/ga_new.jsp#refresh=0
举报 使用道具
6#
Fuller 管理员 发表于 2019-5-22 09:53:49 | 只看该作者
如果你是先在浏览器中做了一些点击和选择以后才看到了要的内容,那么就要观察地址输入栏中的网址,把这个网址拷出来,放在另一个浏览器中加载,如果显示的内容并不是你想要的内容,说明这是一个动态网址,不是独立可加载的网址,那么,光有一个针对看到的结果做的采集规则不够,还需要让爬虫模拟人的点击动作,把需要的内容点击出来才行。这样就要看高级教程,做点击动作了
举报 使用道具
7#
z_nang122 新手上路 发表于 2019-5-22 10:06:21 | 只看该作者
Fuller 发表于 2019-5-22 09:53
如果你是先在浏览器中做了一些点击和选择以后才看到了要的内容,那么就要观察地址输入栏中的网址,把这个网 ...

是的,我发现在GOOSEEKER里面登录去哪儿网,只要一往下拉 其网址就会变 从https://hotel.qunar.com/city/beijing_city/#fromDate=2019-05-23&bs=&bc=%E5%BC%A0%E5%AE%B6%E7%95%8C&QHFP=ZSL_A120F07D&cityurl=&toDate=2019-05-24&from=hotellist 变成 https://hotel.qunar.com/render/ga_new.jsp#refresh=0 后面这个网址复制到其他游览器上确实打不开
举报 使用道具
8#
Fuller 管理员 发表于 2019-5-22 10:20:01 | 只看该作者
z_nang122 发表于 2019-5-22 10:06
是的,我发现在GOOSEEKER里面登录去哪儿网,只要一往下拉 其网址就会变 从https://hotel.qunar.com/city/ ...



我把网址中#后面的内容去掉了,能加载,这个是不是你要的网址?

如果是这个,你把这个网址在会员中心里面添加到你的规则中,而把那个不可用的网址从会员中心中删除,再运行爬虫,采集一次看看能否成功。添加网址的说明在这里,注意新版界面修改了,这里的截图暂时还没有改,不过操作大同小异:https://www.gooseeker.com/doc/thread-667-1-1.html

我觉得去哪儿有静态网址

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
9#
Fuller 管理员 发表于 2019-5-22 10:24:10 | 只看该作者

我也观察到了,集搜客爬虫加载这个网页后,地址会变,所以,样本页面网址不能直接用,现在会员中心删除,然后添加正确的网址

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
10#
Fuller 管理员 发表于 2019-5-22 10:27:13 | 只看该作者
这个网页动态程度太高,DS打数机菜单 配置-》延迟抓取 ,设置5秒,多等待一会,确保加载全了,同时 配置-》定时器触发,要勾上,又需要提高速度,否则,这个网页上的动态代码执行的没完没了,定时器触发可以不等待这些代码的执行
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 利用AI阅读和分析文本:扣子COZE记录用户反
  • 在网页片段内直观标注——以B站评论采集为
  • 利用AI阅读和分析文本:使用COZE建设游记文
  • 使用AI工具Kimi生成python代码为文本分析结
  • 苹果mac电脑安装集搜客网络爬虫软件失败的

热门用户

GMT+8, 2024-11-23 18:17