出现这个提示的原因是什么?

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
| 回复

共 14 个关于本帖的回复 最后回复于 2016-10-11 10:58

沙发
Fuller 管理员 发表于 2016-10-1 15:39:42 | 只看该作者
你抓取规则要抓取的内容是在一个iframe中的,是样本页面有,其他页面没有,所以在抓取的时候,定位不到要抓的内容。

把抓取规则加载到MS谋数台上,在DOM树中定位到一个抓取内容,然后往父节点找,一定会找到一个iframe节点。

然后,在MS谋数台上,选择菜单 工具-〉加载规则-〉按线索号,把上图某个线索编号输入进去,就能加载和分析失败的这个网页是否符合规则,也到DOM树上去找,看看有没有iframe
举报 使用道具
板凳
星星 新手上路 发表于 2016-10-10 22:47:02 | 只看该作者
我也是这个问题,不知道怎么解决,求大神

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
地板
Fuller 管理员 发表于 2016-10-11 09:15:41 | 只看该作者
星星 发表于 2016-10-10 22:47
我也是这个问题,不知道怎么解决,求大神



你是怎样输入查询条件的?我随便输入了以后,抓到的二级网址是这样的,这种不能做二级网址

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
5#
Fuller 管理员 发表于 2016-10-11 09:20:27 | 只看该作者
我看了一下,这个网站内容都是在这个网页中:http://www.shanghaiip.cn/Search/quick/quick.jsp

这个应该是已经剥掉了iframe外层的网页,可以针对它做两层规则
举报 使用道具
6#
星星 新手上路 发表于 2016-10-11 10:10:58 | 只看该作者
那怎么解决呢
举报 使用道具
7#
星星 新手上路 发表于 2016-10-11 10:12:26 | 只看该作者
那我应该去抓取那个网址
举报 使用道具
8#
星星 新手上路 发表于 2016-10-11 10:17:27 | 只看该作者
我的第二层网址和第一层网址是不变的
举报 使用道具
9#
Fuller 管理员 发表于 2016-10-11 10:18:17 | 只看该作者
抓我给出的这个网址,用他来给第一层做规则,就是第一层的规则要修改一下,因为这样就没有iframe了,第一层原先的规则不合适
举报 使用道具
10#
Fuller 管理员 发表于 2016-10-11 10:19:21 | 只看该作者
星星 发表于 2016-10-11 10:17
我的第二层网址和第一层网址是不变的

你做的规则,第二级的网址是怎么抓到的?我看到你的结果文件,确实是真实的url地址,但是我抓到的是javascript代码
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 360或火绒等杀毒软件导致GooSeeker爬虫软件
  • 话题分析(NMF模型和LDA模型)软件的安装和
  • 运行Apple无法验证的程序的方法
  • 文本聚类分析软件的安装和使用方法
  • 利用AI阅读和分析文本:扣子COZE记录用户反

热门用户

GMT+8, 2025-4-24 21:56