21#
liao028 中级会员 发表于 2017-1-14 16:13:41 | 只看该作者
我试试
举报 使用道具
22#
liao028 中级会员 发表于 2017-1-14 16:26:51 | 只看该作者
按你说的做了,可测试结果是第10和11页被跳过去了。你试试呢!谢谢!
举报 使用道具
23#
Fuller 管理员 发表于 2017-1-14 16:58:49 | 只看该作者
liao028 发表于 2017-1-14 16:26
按你说的做了,可测试结果是第10和11页被跳过去了。你试试呢!谢谢!

刚才我测试的时候发现了另一个方法:人员列表是有独立网址的,而且可以单独使用,http://jzsc.mohurd.gov.cn/datase ... /001607220057321927 ,那么就可以做层级采集。从iframe的src中把网址采集下来
举报 使用道具
24#
Fuller 管理员 发表于 2017-1-14 17:11:19 | 只看该作者
liao028 发表于 2017-1-14 16:26
按你说的做了,可测试结果是第10和11页被跳过去了。你试试呢!谢谢!

我加载了你的规则,发现xpath没有改成我刚才贴出来的那个,那就是程序有bug,我已经反馈给研发了。你需要在输入xpath以后,把鼠标移到别的地方点击一下,再点击“存规则”。我测试过,我写的那个xpath是可以用的
举报 使用道具
25#
liao028 中级会员 发表于 2017-1-14 18:46:58 | 只看该作者
我是没有存,直接在谋数台上改了,没有点存规则,直接点的“爬数据”。
举报 使用道具
26#
liao028 中级会员 发表于 2017-1-14 18:47:57 | 只看该作者
不行的话,那我试试你说的,层级采集吧。
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-6 00:25