集搜客GooSeeker网络爬虫

标题: 要怎样做才能区分商品的品牌、类别? [打印本页]

作者: 丠道    时间: 2015-12-3 10:30
标题: 要怎样做才能区分商品的品牌、类别?
我抓取了这样的数据,不过车型,品牌,车系都没分,这个比较头疼。
[attach]440[/attach]
我想问采集时怎样能区分品牌类别?
[attach]439[/attach]



作者: ym    时间: 2015-12-3 10:33
本帖最后由 ym 于 2015-12-3 10:36 编辑

方法1:你可以在规则里多建一个整理箱,用来抓品牌车系,然后手工把品牌车系的网址弄出来,然后导入到规则里,DS采数据时就能把品牌车系采到,而且数据文件里的fullpath字段就是采集的网址,根据这个也能区分,了解多个整理箱看http://www.gooseeker.com/doc/for ... 4%E7%90%86%E7%AE%B1
[attach]443[/attach]

方法2:你也可以看看连续动作的教程,可以设置点击,采集的时候就自动点击品牌车系 http://www.gooseeker.com/doc/article-141-1.html
作者: Fuller    时间: 2015-12-3 10:38
如果你的意思是说一个字段的文字中既有品牌也有车系,要把这个字符串切开,我建议在excel中切,比较好切,因为是用空格隔开的。在抓取规则中分成3个抓取内容也可以,内容映射是一样的,但是要各自做自定义xpath用sub-string()函数,xpath的字符串函数很弱,所以,自定义xpath会写的很长




欢迎光临 集搜客GooSeeker网络爬虫 (https://www.gooseeker.com/doc/) Powered by Discuz! X3.2