集搜客生成的采集规则,如何才能够在Python中运行?
举报 使用道具
| 回复

共 5 个关于本帖的回复 最后回复于 2016-9-8 12:04

沙发
ym 版主 发表于 2016-9-8 12:02:18 | 只看该作者
可以,参考python集成方法http://www.gooseeker.com/doc/thread-1824-1-1.html
举报 使用道具
板凳
噬鳴玥 新手上路 发表于 2016-9-8 12:02:36 | 只看该作者
ym 发表于 2016-9-8 12:02
可以,参考python集成方法http://www.gooseeker.com/doc/thread-1824-1-1.html

嗯嗯,那集搜客生成的规则是  不是xpath语句啊?
举报 使用道具
地板
ym 版主 发表于 2016-9-8 12:02:51 | 只看该作者
是的
举报 使用道具
5#
噬鳴玥 新手上路 发表于 2016-9-8 12:03:25 | 只看该作者
我把集搜客生成的规则放到 Python中直接运行,出问题了。应该怎么导入规则变成Python可识别的语言呢  
举报 使用道具
6#
ym 版主 发表于 2016-9-8 12:04:50 | 只看该作者
看刚才发的链接,建议你直接使用api,而不是把规则文件拷贝出来,用api的话,你可以做一个通用爬虫
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-18 04:50