4 8575

层级采集问题

jiangsuxincheng 于 2017-7-4 11:31 发表 [复制链接]
1.png 我要采集这样的网站信息 http://218.94.78.91:19001/REG/f/announcement/announcementShow,我的第一级规则名建设项目,第二级规则名建设项目2,爬虫采集的时候第一级采集全采集下来了,第二级采集只是其中我做规则的那条信息,请帮忙看一下,我也是根据教程采网址做层级采集——以大众点评为例来学习的。总觉得抓取数据哪里不对
举报 使用道具
| 回复

共 4 个关于本帖的回复 最后回复于 2017-7-4 11:46

jiangsuxincheng 初级会员 发表于 2017-7-4 11:39:37 | 显示全部楼层
我看了下应该是我爬取的时候没有改线索数量
举报 使用道具
jiangsuxincheng 初级会员 发表于 2017-7-4 11:39:50 | 显示全部楼层
网页数
举报 使用道具
shengchengx 金牌会员 发表于 2017-7-4 11:45:26 | 显示全部楼层

只抓了一个可能没有更改单搜的线索数呢
然后你这边翻页没有做呢

举报 使用道具
jiangsuxincheng 初级会员 发表于 2017-7-4 11:46:58 | 显示全部楼层
我刚学习只是根据教程测试下,所以没翻页,谢谢你了
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-3-28 20:31