11#
zhanyi101 中级会员 发表于 2016-7-27 13:59:10 | 只看该作者
boss在吗?
我想请问一下直接通过自定义xpath来构建下一级线索这个问题解决了吗??
举报 使用道具
12#
wangyong 版主 发表于 2016-7-27 17:19:48 | 只看该作者
zhanyi101 发表于 2016-7-27 13:59
boss在吗?
我想请问一下直接通过自定义xpath来构建下一级线索这个问题解决了吗?? ...

可以通过xpath来自定义下级线索
举报 使用道具
13#
zhanyi101 中级会员 发表于 2016-7-27 17:58:14 | 只看该作者
wangyong 发表于 2016-7-27 17:19
可以通过xpath来自定义下级线索

我知道应该可以,但是在我提供的这个网址里面貌似不行。。。。
举报 使用道具
14#
Fuller 管理员 发表于 2016-7-27 21:45:21 | 只看该作者
在GooSeeker网络爬虫里面,这个网站直接构造网址不行,但是在火狐浏览器中可以,这个问题的根本原因还没有找到。

但是,如果在网络爬虫里面从最初的入口页面点击进去,又能看到目标网页内容。目前初步判断是网络爬虫浏览器的缓存管理与普通浏览器的不一样。需要测试和实验才能找到根本原因。目前只能用飞掠模式,从最初入口页面连续点击进到目标页面中
举报 使用道具
15#
zhanyi101 中级会员 发表于 2016-7-27 21:50:12 | 只看该作者
这么晚还在加班,真是辛苦了!
看来这个问题只能留给你们慢慢解决了!
我暂时只能换个思路来采集数据了!
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-17 17:41