41#
Fuller 管理员 发表于 2018-9-1 16:06:40 | 只看该作者
gooseeker_influen 发表于 2018-9-1 15:58
你好,能问下抓取追评是怎么实现的吗?因为有的有追评有的没追评这个比较头疼 ...

如果有追评的评论是在评论列表里面的第一个,那就好做了,因为集搜客爬虫一第一个作为样例定义抓取内容的映射关系。然后选择第一个和第二个做样例复制映射,得到复制规律。如果不在第一个有追评,这个过程就变得比较复杂。

如果是在第一个,只需建立一个嵌套的整理箱,就是大箱子里面套着小箱子,小箱子用来存所有追评,嵌套整理箱这里有个说明:https://www.gooseeker.com/doc/thread-10764-1-1.html

内层小箱子的抓取内容不要勾选“关键内容”,因为他们有时候没有

如果不是在第一个有追评,可在中间某个有追评的上面做内容映射,完成以后,以它做为第一个,下一个作为第二个做样例复制映射,存规则以后,要手工修改规则,把样例复制起点手工修改了,再“保存修改”
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-25 13:09