出现这个提示的原因是什么?

举报 使用道具
| 回复

共 14 个关于本帖的回复 最后回复于 2016-10-11 10:58

沙发
Fuller 管理员 发表于 2016-10-1 15:39:42 | 只看该作者
你抓取规则要抓取的内容是在一个iframe中的,是样本页面有,其他页面没有,所以在抓取的时候,定位不到要抓的内容。

把抓取规则加载到MS谋数台上,在DOM树中定位到一个抓取内容,然后往父节点找,一定会找到一个iframe节点。

然后,在MS谋数台上,选择菜单 工具-〉加载规则-〉按线索号,把上图某个线索编号输入进去,就能加载和分析失败的这个网页是否符合规则,也到DOM树上去找,看看有没有iframe
举报 使用道具
板凳
星星 新手上路 发表于 2016-10-10 22:47:02 | 只看该作者
我也是这个问题,不知道怎么解决,求大神

分层.zip

11.36 KB, 下载次数: 3

举报 使用道具
地板
Fuller 管理员 发表于 2016-10-11 09:15:41 | 只看该作者
星星 发表于 2016-10-10 22:47
我也是这个问题,不知道怎么解决,求大神



你是怎样输入查询条件的?我随便输入了以后,抓到的二级网址是这样的,这种不能做二级网址
举报 使用道具
5#
Fuller 管理员 发表于 2016-10-11 09:20:27 | 只看该作者
我看了一下,这个网站内容都是在这个网页中:http://www.shanghaiip.cn/Search/quick/quick.jsp

这个应该是已经剥掉了iframe外层的网页,可以针对它做两层规则
举报 使用道具
6#
星星 新手上路 发表于 2016-10-11 10:10:58 | 只看该作者
那怎么解决呢
举报 使用道具
7#
星星 新手上路 发表于 2016-10-11 10:12:26 | 只看该作者
那我应该去抓取那个网址
举报 使用道具
8#
星星 新手上路 发表于 2016-10-11 10:17:27 | 只看该作者
我的第二层网址和第一层网址是不变的
举报 使用道具
9#
Fuller 管理员 发表于 2016-10-11 10:18:17 | 只看该作者
抓我给出的这个网址,用他来给第一层做规则,就是第一层的规则要修改一下,因为这样就没有iframe了,第一层原先的规则不合适
举报 使用道具
10#
Fuller 管理员 发表于 2016-10-11 10:19:21 | 只看该作者
星星 发表于 2016-10-11 10:17
我的第二层网址和第一层网址是不变的

你做的规则,第二级的网址是怎么抓到的?我看到你的结果文件,确实是真实的url地址,但是我抓到的是javascript代码
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-3 07:26