我想抓取所有金华地区天猫店铺的店铺名字、月销量、公司名和4个爆款的价格,并且将抓取结果放到一张Excel表中,然后遇到下面几个问题,麻烦版主帮忙解决一下~
1、我把两个分级的主题(天猫金华旗舰店、店铺信息)都定义好了,但抓取结果是店铺信息只抓到了第一个店铺,其余的都没有
2、因为需要在店铺列表页面点一个链接才能到达店铺信息页面,所以我设置了二级抓取。但这样抓取的结果是同一个店铺的信息放到了两个地方(主题文件夹),有没有办法在一个主题里实现(即不用分级)?
3、怎样把所有的抓取结果导入到一张Excel表中?表格第一行的标题类似如下:
店铺名 月销量 爆款价格1 爆款价格2 爆款价格3 爆款价格4 公司名
Thank you very much!
抓取结果存放
问题答案如下:
1,我加载了您的信息结构,发现第二级的主题名是“天猫金华旗舰店铺信息”,不是“店铺信息”,那么抓取第一级的时候,会为“天猫金华旗舰店铺信息”生成多个线索,而“店铺信息”这个主题不会有线索。
2,抓取结果按照主题名分开存放的,不会因为是上级和下级关系放在一起。我们不推荐用同一个主题描述两个结构完全不一样的网页。如果确实想用同一个主题,可以为两个不同结构的网页定义辅名不同的两个信息结构,参看《同主题多个不同信息结构》
3,存入EXCEL表需要配套的软件,如果您的采集量比较小,建议找一个免费软件,可以将xml转换成excel。在我们的网站上搜索excel,可以看到一些相关帖子
非常感谢
版主很热心,遇到的问题您都能帮我解决,非常感谢^_^
Fuller在吗
能不能帮我看一下啊,谢谢了!