第二级线索都只有1
我做了一个多层级网页采集数据,第一级爬虫路线的主题名是对的 ,但爬完第一级后,第二级的线索都还是只有 1 (有样例复制应该有十笔)

不知要如何把第一级和第二级勾迹起来 (第一级爬虫路线的主题名和第二级的主题名是一样的!)

第一级主题名: DSC_TS2000_1
第二级主题名: DSC_TS2000_2

举报 使用道具
| 回复

共 15 个关于本帖的回复 最后回复于 2017-11-17 15:18

沙发
umsung 高级会员 发表于 2017-11-15 14:53:29 | 只看该作者
加载进去无法访问,这是个国外的网站吗?

QQ截图20171115145114.jpg (16.83 KB, 下载次数: 789)

QQ截图20171115145114.jpg
举报 使用道具
板凳
DSCTDC10 初级会员 发表于 2017-11-15 15:02:31 | 只看该作者
呃,是台灣的網站 , 可以從設定內容看出問題嗎? 或是操作上有什麼我可能沒有注意到 ?
举报 使用道具
地板
umsung 高级会员 发表于 2017-11-15 15:06:24 | 只看该作者
加载不出来,所以看不到你的规则是怎样做的。
1,需要注意第一级的目标主题名和第二级的主题名是否对应一致,如果不一致就会出现这种情况
2,查看第一级规则有没有生成线索给第二级,在打数机右击第二级规则-统计线索能看到线索数。
举报 使用道具
5#
DSCTDC10 初级会员 发表于 2017-11-15 15:12:19 | 只看该作者
1.是一致的
2.统计线索 都是只有 1

擷取.JPG (92.19 KB, 下载次数: 759)

擷取.JPG
举报 使用道具
6#
umsung 高级会员 发表于 2017-11-15 15:22:56 | 只看该作者
先运行第一级规则,看看第一级规则有没有把线索抓下来和第二级规则有没有生成线索。
1,如果连线索都没有抓下来就是第一级规则的问题
2,如果第一级规则把线索抓下来了,第二级规则没有生成线索,那就要看是不是写错目标主题名了。
举报 使用道具
7#
DSCTDC10 初级会员 发表于 2017-11-15 15:23:12 | 只看该作者
第一級有什麼情況會無法生成線索給第二級嗎 ?
举报 使用道具
8#
umsung 高级会员 发表于 2017-11-15 15:28:18 | 只看该作者
只要勾了下级线索就会生产线索给下一级,除非没有下一级规则。第一级如果都不能把线索抓下来就无法生成线索给第二级
举报 使用道具
9#
DSCTDC10 初级会员 发表于 2017-11-15 15:34:10 | 只看该作者
第一級有抓到線索 (如附件URL)

DSC_TS2000_1_13915311_3193355621.rar

717 Bytes, 下载次数: 3

举报 使用道具
10#
DSCTDC10 初级会员 发表于 2017-11-15 15:35:53 | 只看该作者
第二級就只能抓到一筆 (如附件)

DSC_TS2000_2_13920343_3197754305.rar

646 Bytes, 下载次数: 1

举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-5 23:11