集搜客GooSeeker网络爬虫
标题:
要怎样做才能区分商品的品牌、类别?
[打印本页]
作者:
丠道
时间:
2015-12-3 10:30
标题:
要怎样做才能区分商品的品牌、类别?
我抓取了这样的数据,不过车型,品牌,车系都没分,这个比较头疼。
[attach]440[/attach]
我想问采集时怎样能区分品牌类别?
[attach]439[/attach]
作者:
ym
时间:
2015-12-3 10:33
本帖最后由 ym 于 2015-12-3 10:36 编辑
方法1:你可以在规则里多建一个整理箱,用来抓品牌车系,然后手工把品牌车系的网址弄出来,然后导入到规则里,DS采数据时就能把品牌车系采到,而且数据文件里的fullpath字段就是采集的网址,根据这个也能区分,了解多个整理箱看
http://www.gooseeker.com/doc/for ... 4%E7%90%86%E7%AE%B1
[attach]443[/attach]
方法2:你也可以看看连续动作的教程,可以设置点击,采集的时候就自动点击品牌车系
http://www.gooseeker.com/doc/article-141-1.html
作者:
Fuller
时间:
2015-12-3 10:38
如果你的意思是说一个字段的文字中既有品牌也有车系,要把这个字符串切开,我建议在excel中切,比较好切,因为是用空格隔开的。在抓取规则中分成3个抓取内容也可以,内容映射是一样的,但是要各自做自定义xpath用sub-string()函数,xpath的字符串函数很弱,所以,自定义xpath会写的很长
欢迎光临 集搜客GooSeeker网络爬虫 (https://www.gooseeker.com/doc/)
Powered by Discuz! X3.2