点击网页上的链接,会有对话框弹出来,怎样抓取?
举报 使用道具
| 回复

共 1 个关于本帖的回复 最后回复于 2016-9-30 10:14

沙发
Fuller 管理员 发表于 2016-9-30 10:14:09 | 只看该作者
我们日常说的对话框范围很广,需要严格分类后再有针对性地进行抓取。

1)网页上的浮动窗体:很多网页,为了提高用户体验,弹出框其实是一个浮动窗体,跟当前网页是一个html,比如,是一个能浮动居中的DIV,那么,抓取方法很简单,就是在div中把需要的节点内容存下来。如果同时要实现点击或者滑动鼠标动作,那么参看连续动作的教程,其中一个案例:移动鼠标抓取浮窗:http://www.gooseeker.com/doc/article-138-1.html

2)弹出一个新的浏览器窗口:严格说这不叫对话框,也是一个浏览器窗口,只是可能没有显示工具条和地址输入栏,是一个简化的窗口。这种情况下,如果无法用层级抓取,那么只能用GooSeeker的飞掠模式,专门用于抓取弹出窗口,参看:http://www.gooseeker.com/doc/thread-2221-1-1.html

3)是一个严格意义上的对话框:就是网页上用alert()函数弹出的窗口,这是一种特殊窗口,这种窗口主要显示一句提示和几个按钮。如果确实需要抓这个窗口的内容,需要联系我们定制一个版本。因为这种抓取需求很少,暂时还没有放到版本计划中,只能专门定制
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-24 13:02