本帖最后由 1866905838 于 2017-3-13 23:46 编辑

第一层主题:艺术个人信息

第二层主题:医生个人信息2
第三层主题:医生个人信息3

第一层连接第二层,第二层模拟点击后取内容

问题:
为啥运行第一层主题后,主题2和主题3没有结果?
请大神诊断诊断
但是手动运行主题1后,在运行主题2,能带出主题3的内容,

第二层.png (504.18 KB, 下载次数: 584)

第二步

第二步

抓取第一步.png (25.17 KB, 下载次数: 562)

第一步

第一步

第三层.png (420.08 KB, 下载次数: 570)

第三步

第三步
举报 使用道具
| 回复

共 5 个关于本帖的回复 最后回复于 2017-3-15 09:43

沙发
HJLing 版主 发表于 2017-3-14 10:29:58 | 只看该作者
第一级规则(艺术个人信息)和第二级规则(医生个人信息2)是层级关系 需要分开运行
即:既要手动去运行第一级规则 也要去运行第二级规则
第二级规则(医生个人信息2)和第三级规则(医生个人信息3)是模拟点击联系起来的 所以不需要手动运行第三级规则
你运行第二级规则的时候就会自动调用第三级规则

所以 你需要手动运行第一级规则和第二级规则

另外 你的第二级规则 给完整内容建立了一个下级线索 这是多余的 查看完整内容不是个链接而是文本 这样做反而会生成很多无效的网址 这个要删掉

举报 使用道具
板凳
1866905838 初级会员 发表于 2017-3-14 14:07:47 | 只看该作者
HJLing 发表于 2017-3-14 10:29
第一级规则(艺术个人信息)和第二级规则(医生个人信息2)是层级关系 需要分开运行
即:既要手动去运行第一级 ...

感谢,你的回复解答我了疑惑,我懂了这个层级的原理。但是,我先又有了个关于

主题:艺术个人信息 的 一个问题?
问题如下:
我需要抓取“访问个人网站”下的网址,但是经过实际运行,我发现我抓取到的都是,“宋毅军”(即医生名字下的王网址)。

看过好多遍,内容映射的没啥问题。
另外需要说明的是,有的医生和面没有“访问个人网站”的连接。




还请大神给予解决~

问题截图.png (29.15 KB, 下载次数: 575)

问题截图.png

问题描述.png (23.38 KB, 下载次数: 560)

问题描述.png
举报 使用道具
地板
HJLing 版主 发表于 2017-3-14 14:14:38 | 只看该作者
1866905838 发表于 2017-3-14 14:07
感谢,你的回复解答我了疑惑,我懂了这个层级的原理。但是,我先又有了个关于

主题:艺术个人信息 [/bac ...


定位标志映射的节点找得不好 你之前使用blue 这个值跟医生名字的链接是同一个class值 要找唯一的值比如截图中的yy_jb_df

举报 使用道具
5#
1866905838 初级会员 发表于 2017-3-14 19:58:33 | 只看该作者
HJLing 发表于 2017-3-14 14:14
定位标志映射的节点找得不好 你之前使用blue 这个值跟医生名字的链接是同一个class值 要找唯一的值比如 ...

感谢!帮助,会积极分享GooSeeker给我的朋友的~~
感谢!
举报 使用道具
6#
HJLing 版主 发表于 2017-3-15 09:43:07 | 只看该作者
1866905838 发表于 2017-3-14 19:58
感谢!帮助,会积极分享GooSeeker给我的朋友的~~
感谢!


举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-7 18:33