在使用连续动作 自动搜索关键字 有两个问题
以教程里的京东空调为例

1 对于第二层收集到的数据,有没有可能自动批量导出? (现在数据是以xml格式存在电脑上,我知道可以把xml打包,然后批量转换。但是能不能像通常爬虫群那样,直接按批量导出呢?)
2 想使用连发弹仓功能,所以会有很多个关键字。 怎样可以实现第二层采集到的信息和第一层的关键字相匹配呢? (比方说,在第一层输入美的型号1(2 3 4 ),在第二层收集这个空调的相关信息1(2 3 4 ),希望得到的结果是型号1(2 3 4)和信息(1 2 3 4)相匹配)
举报 使用道具
| 回复

共 2 个关于本帖的回复 最后回复于 2018-1-6 15:02

沙发
Fuller 管理员 发表于 2018-1-6 10:12:24 | 只看该作者
批量导出或者API功能都需要定制,你提需求,我们评估费用,然后专门给你开发

请看《XML网页结构》,里面讲了每个字段的含义,连续动作经过多个主题的话,需要用xml文件中的相关字段关联起来,actionvalue里面会存储输入的关键词。还有这个文档《以下拉菜单为例讲解讲解xml文件结构》,进一步将了多级主题名的表达方式,actionvalue的内容
举报 使用道具
板凳
yueguansz 中级会员 发表于 2018-1-6 15:02:39 | 只看该作者
Fuller 发表于 2018-1-6 10:12
批量导出或者API功能都需要定制,你提需求,我们评估费用,然后专门给你开发

请看《XML网页结构》,里面讲 ...

好的 谢谢。是的,发现actionvalue里有关键字,可以事后再用其他软件匹配整理
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-26 04:38