1、层级抓取在执行第二层级页面信息抓取时,若有多条二级页面(并行的),抓取出来的xml文件都是分开的,有没有办法直接让这些同级页面信息直接在抓取时就整合在一个xml文件中

2、翻页抓取也会有这个问题,有没有办法让所有的页面都在一个文件中

求教

举报 使用道具
| 回复

共 3 个关于本帖的回复 最后回复于 2015-9-26 18:06

ym 版主 发表于 2015-9-25 14:18:54 | 显示全部楼层
可以把每个规则采集到的xml文件导入一个excel中,可以参考教程如何将xml文件导入excel
举报 使用道具
Madzero 初级会员 发表于 2015-9-26 09:59:30 | 显示全部楼层
ym 发表于 2015-9-25 14:18
可以把每个规则采集到的xml文件导入一个excel中,可以参考教程如何将xml文件导入excel ...

谢谢
举报 使用道具
zjmok9 新手上路 发表于 2015-9-26 18:06:12 | 显示全部楼层
我用的WPS(微软的office没试过),把xml文件用WPS的EXCEL打开,打开后另存为EXCEL文件。好像很简单哦。
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-16 21:40