规则:上海律师主信息

采集数据29537条,共1800多页,全部采集完成,但是导出excel只有1887条数据,请帮忙看看怎么回事
举报 使用道具
| 回复

共 6 个关于本帖的回复 最后回复于 2021-9-22 12:02

Fuller 管理员 发表于 2021-9-20 08:21:27 | 显示全部楼层
没有找到这个规则
举报 使用道具
jesscia_2020 高级会员 发表于 2021-9-22 09:03:13 | 显示全部楼层
我这有呀,好像都采集不全了,麻烦帮忙看看,谢谢
Screenshot 2021-09-22_09-02-44-464.png
举报 使用道具
Fuller 管理员 发表于 2021-9-22 11:46:08 | 显示全部楼层
这个规则没有做样例映射,所以,每个网页只采集了一条数据
举报 使用道具
jesscia_2020 高级会员 发表于 2021-9-22 11:52:13 | 显示全部楼层
之前只采集第一页的会不会也和没有做样例映射又关系
举报 使用道具
Fuller 管理员 发表于 2021-9-22 12:01:24 | 显示全部楼层
jesscia_2020 发表于 2021-9-22 11:52
之前只采集第一页的会不会也和没有做样例映射又关系

具体要检查一下那个规则,加载以后,在定义采集工作台上点击“测试”按钮,看看采集到多少条
举报 使用道具
jesscia_2020 高级会员 发表于 2021-9-22 12:02:15 | 显示全部楼层
之前的没有做样例映射,点击测试以后,当页的数据页显示完全了。
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-3-29 01:41