最后登录 1970-1-1
ippfon 发表于 2016-8-12 10:10 GooSeeker开源Python网络爬虫GitHub源 可以先尝试看看官方的示例源代码,上面有以scrapy为框架,使用GsExt ...
最后登录 2024-12-23
xiaoyuvps 发表于 2016-8-12 15:24 我看了这部分。 我想知道GS_EX2输出的格式是固定的么?
Fuller 发表于 2016-8-12 15:32 目前,GooSeeker的所有爬虫产品输出的格式都是xml
xiaoyuvps 发表于 2016-8-12 15:37 所以现在就有一个问题了。 我第一个parse 过程 把列表页采集出来所有的详情 输出为XML
Fuller 发表于 2016-8-12 16:31 如果要做结果合并,最好入到数据库,比如MySQL或者MongoDB gs_extractor输出成XML,因为抓取规则是一个 ...
发表回复 回帖并转播 回帖后跳转到最后一页
GMT+8, 2024-12-24 04:14
共 6 个关于本帖的回复 最后回复于 2016-8-12 16:48