例如和讯博客使用qq的登录,1688和天猫的登录,他们好像都用iframe框架显示登录窗口,集搜客是否支持?
举报 使用道具
| 回复

共 1 个关于本帖的回复 最后回复于 2016-9-19 15:13

沙发
Fuller 管理员 发表于 2016-9-19 15:13:38 | 只看该作者
GooSeeker爬虫软件可以完全模拟人的行为,普通人浏览网页的时候不会管是否有iframe,GooSeeker网络爬虫也能做到这一点,用户抓取数据的时候可以不用管iframe的存在,iframe不过是嵌套在html的 DOM树中的一个分支。

GooSeeker自动生成的XPath对标准的XPath进行了扩展,把iframe很自然地当成了一个分支,而标准XPath不能用一条xpath语句从外层html深入到iframe的。

有一种情形需要注意一下:在同一个规则中,要抓取的内容有些位于iframe外,有些位于iframe内,需要把他们分别放在不同的整理箱中。除此以外,不用管是否有iframe存在
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-7 16:40