11#
zhanyi101 中级会员 发表于 2016-7-27 13:59:10 | 只看该作者
boss在吗?
我想请问一下直接通过自定义xpath来构建下一级线索这个问题解决了吗??
举报 使用道具
12#
wangyong 版主 发表于 2016-7-27 17:19:48 | 只看该作者
zhanyi101 发表于 2016-7-27 13:59
boss在吗?
我想请问一下直接通过自定义xpath来构建下一级线索这个问题解决了吗?? ...

可以通过xpath来自定义下级线索
举报 使用道具
13#
zhanyi101 中级会员 发表于 2016-7-27 17:58:14 | 只看该作者
wangyong 发表于 2016-7-27 17:19
可以通过xpath来自定义下级线索

我知道应该可以,但是在我提供的这个网址里面貌似不行。。。。
举报 使用道具
14#
Fuller 管理员 发表于 2016-7-27 21:45:21 | 只看该作者
在GooSeeker网络爬虫里面,这个网站直接构造网址不行,但是在火狐浏览器中可以,这个问题的根本原因还没有找到。

但是,如果在网络爬虫里面从最初的入口页面点击进去,又能看到目标网页内容。目前初步判断是网络爬虫浏览器的缓存管理与普通浏览器的不一样。需要测试和实验才能找到根本原因。目前只能用飞掠模式,从最初入口页面连续点击进到目标页面中
举报 使用道具
15#
zhanyi101 中级会员 发表于 2016-7-27 21:50:12 | 只看该作者
这么晚还在加班,真是辛苦了!
看来这个问题只能留给你们慢慢解决了!
我暂时只能换个思路来采集数据了!
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 运行Apple无法验证的程序的方法
  • 文本聚类分析软件的安装和使用方法
  • 利用AI阅读和分析文本:扣子COZE记录用户反
  • 在网页片段内直观标注——以B站评论采集为
  • 利用AI阅读和分析文本:使用COZE建设游记文

热门用户

GMT+8, 2024-12-20 15:17