最后登录 1970-1-1
您需要 登录 才可以下载或查看,没有帐号?立即注册
gooseeker_info 发表于 2015-10-14 22:08 很有可能没有设置“关键内容”,创建了抓取内容字段以后,把重要的勾上“关键内容”,也就是一定要确保采集 ...
Wadechosen 发表于 2015-10-15 20:21 嗯 确实是这样的 还有一个问题想请教一下,怎样设置才能让生成的xml文件尽量大一点。现在每个xml文件中 ...
gooseeker_info 发表于 2015-10-15 20:46 一个网页对应一个xml,目前设置不了,可以导入excel时合成一个,这里有个工具:http://www.gooseeker.com ...
Wadechosen 发表于 2015-10-15 23:20 一个网页对应一个xml,那就是如果一个网页里面有十条记录,那么对应的xml文件里面也应该有十条记录对吗 ...
gooseeker_info 发表于 2015-10-15 23:38 是的
Wadechosen 发表于 2015-10-16 19:09 那如果我在样例的网页中以第5条评论做规则,那是不是抓取数据的时候就是从每页的第5条开始抓取数据呢 ...
gooseeker_info 发表于 2015-10-16 21:13 抓取多实例有多种方式,我们常用的是样例复制,那么从第5条开始做规则,就只能从第5条开始。 还有一种: ...
发表回复 回帖并转播 回帖后跳转到最后一页
GMT+8, 2025-2-23 12:48
共 8 个关于本帖的回复 最后回复于 2015-10-16 21:56