快捷导航
我之前创建了二级规则并创建了下级线索,然后爬数据的时候成功爬取了二级规则的线索(PS二级规则内含有翻页抓取及标题链接,三级规则为层级抓取的内容),然后我运行三级规则发现速度特别慢,而且老是匹配失败,于是我就中断数据爬取,并删除了三级规则主题名。之后按照之前的名字重新创建了三级线索及主题名,但是发现原来的关系图中二级线索的下级线索已经不存在了,成功创建的三级线索图中也不和任何线索形成上下级关联,请问该如何解决(我现在就想知道我的二级线索的主题名与三级线索主题名一致为什么无法关联线索)

举报 使用道具
| 回复

共 3 个关于本帖的回复 最后回复于 2018-1-4 14:07

数据集二期 中级会员 发表于 2018-1-4 12:22:28 | 显示全部楼层
规则名是什么?规则没关联上应该是主题名没对应上,检查爬虫路线的目标主题名和下一级主题名是否一致。
举报 使用道具
ayeah123 新手上路 发表于 2018-1-4 13:09:52 | 显示全部楼层
数据集二期 发表于 2018-1-4 12:22
规则名是什么?规则没关联上应该是主题名没对应上,检查爬虫路线的目标主题名和下一级主题名是否一致。 ...

名称一致的,这是二级规则的主题名,这是目标下一级线索的目标主题名,这是创建好的下级规则主题名,检查过,应该是一致的
举报 使用道具
数据集二期 中级会员 发表于 2018-1-4 14:07:10 | 显示全部楼层
ayeah123 发表于 2018-1-4 13:09
名称一致的,这是二级规则的主题名,这是目标下一级线索的目标主题名,这是创建好的下级规则主题名,检查 ...

看不到你发出来的图片,把规则名用文字贴出来,不然无法检查。
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 通过箱线图看一线城市行业的招聘分布
  • 爬取豆瓣电影短评做中文分词与数据分析
  • ROST CM6分词软件下载安装
  • 学习Rost-CM内容挖掘系统的分词工具
  • 城市要素库时空分析系统开发设计要点

热门用户

集搜客GooSeeker网络爬虫 ( 粤ICP备11065265号-2 )

GMT+8, 2018-4-27 06:52