求教。。。。自己写的是这样,下载别人的抓取数据也是这样

QQ图片20161122111557.png (63.54 KB, 下载次数: 880)

QQ图片20161122111557.png
举报 使用道具
| 回复

共 15 个关于本帖的回复 最后回复于 2016-11-24 17:27

沙发
HJLing 版主 发表于 2016-11-22 18:02:43 | 只看该作者
你这个规则是下载的吗?把下载网址发出来看看
举报 使用道具
板凳
Fuller 管理员 发表于 2016-11-22 18:29:57 | 只看该作者
下载的规则的网址是哪个? 这个规则到第二页就不适合了,自定义xpath到第二页就不对了。

举报 使用道具
地板
xiaokn 新手上路 发表于 2016-11-22 20:30:04 | 只看该作者
HJLing 发表于 2016-11-22 18:02
你这个规则是下载的吗?把下载网址发出来看看

www.gooseeker.com/res/detail_95922.html
举报 使用道具
5#
Fuller 管理员 发表于 2016-11-22 20:33:12 | 只看该作者
xiaokn 发表于 2016-11-22 20:30
www.gooseeker.com/res/detail_95922.html

明天我联系发布者重新修改一下,你重新下载,不扣积分
举报 使用道具
6#
xiaokn 新手上路 发表于 2016-11-22 20:39:50 | 只看该作者
Fuller 发表于 2016-11-22 18:29
下载的规则的网址是哪个? 这个规则到第二页就不适合了,自定义xpath到第二页就不对了。

...

国家食品药品监督管理局列表那个,网址回复了,那这样怎么定位,他JS生成的
举报 使用道具
7#
xiaokn 新手上路 发表于 2016-11-22 20:40:58 | 只看该作者
Fuller 发表于 2016-11-22 20:33
明天我联系发布者重新修改一下,你重新下载,不扣积分

教我也可以的,我爬别的用,下载他的也是在看写法,因为我自己写的就是这样卡在第二页
举报 使用道具
8#
Fuller 管理员 发表于 2016-11-22 22:37:45 | 只看该作者
xiaokn 发表于 2016-11-22 20:40
教我也可以的,我爬别的用,下载他的也是在看写法,因为我自己写的就是这样卡在第二页
...

集搜客网络爬虫跟其他软件不一样,你基本上不用管是否有javascript动态内容,动态和静态的处理方法是一样的,都是做直观标注就能自动生成规则。使用相同的机制检验抓取规则是否能匹配的上,动态内容只是会稍微多等待一会,也不要自己设置等待多久,程序会评估匹配度。

如果你要自己学习怎样使用的话,在教程首页左栏,看《从入门到精通》那个教程。

这个规则十分简单,只有两个抓取内容,不知道为什么作者要使用自定义xpath,只有等明天我问问他
举报 使用道具
9#
Fuller 管理员 发表于 2016-11-23 10:30:58 | 只看该作者
这个规则已经修改好了,可以重新下载了,重新下载不扣积分
举报 使用道具
10#
xiaokn 新手上路 发表于 2016-11-23 10:41:04 | 只看该作者
Fuller 发表于 2016-11-23 10:30
这个规则已经修改好了,可以重新下载了,重新下载不扣积分

谢谢,一会学习一下
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-16 03:48