3 7454

怎么看抓取失败的关键词

数据菊 于 2017-11-15 22:49 发表 [复制链接]
我用百度地图搜地址,因为关键词也是爬虫爬来的,格式没弄好导致查找失败。我知道有这么些关键词,但是因为量很大,一个个找和改很麻烦。我想直接先爬着,把失败的筛出来改就方便多了。但是我在会员中心只找到失败线索。搜索时网址是不会变的,变成线索从头到尾都只有一条。
举报 使用道具
| 回复

共 3 个关于本帖的回复 最后回复于 2017-11-17 14:32

yangwenge 金牌会员 发表于 2017-11-16 09:20:46 | 显示全部楼层
在会员中心批量添加的关键词,可以在会员中心--规则管理--规则名--查看中看到采集情况
J`9}HUJW[F0I{C9YOQRUJAX.png
举报 使用道具
数据菊 中级会员 发表于 2017-11-17 13:03:55 | 显示全部楼层
yangwenge 发表于 2017-11-16 09:20
在会员中心批量添加的关键词,可以在会员中心--规则管理--规则名--查看中看到采集情况
...


关键词查看那里只能看抓过没有,看不到抓取失败的。选中的那个是我看着它匹配失败的,但是它也显示不出来。
关键词抓取.JPG
举报 使用道具
yangwenge 金牌会员 发表于 2017-11-17 14:32:30 | 显示全部楼层
数据菊 发表于 2017-11-17 13:03
关键词查看那里只能看抓过没有,看不到抓取失败的。选中的那个是我看着它匹配失败的,但是它也显示不出 ...

匹配失败可能的原因是采集规则匹配失败了,可以检查下采集规则。
列如:采集规则勾选了关键内容,但是输入关键词后没有搜索结果。


举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-3-28 18:25