14 21829

翻页

lsckyj 于 2018-4-30 12:21 发表 [复制链接]
bowieD 金牌会员 发表于 2018-5-2 15:31:07 | 显示全部楼层
lsckyj 发表于 2018-5-2 15:25
我试了一下,还是不行,是不是在豆瓣上面只能爬200多条

根据“小猪佩奇”这个主题名搜索不到你的规则,首先观察一下一共有多少条数据,只爬了200多条应该是翻页到某一页,采集的关键内容就定位不到就报错中断了,采集的时候观察一下在哪一页中断了,再根据Fuller所说的方法检查和调整内容映射。
举报 使用道具
lsckyj 初级会员 发表于 2018-5-2 20:11:15 | 显示全部楼层
E:\
举报 使用道具
lsckyj 初级会员 发表于 2018-5-2 20:12:39 | 显示全部楼层
E:\
我没用小猪佩奇啦,用的是红海行动。不行,都想放弃啦
举报 使用道具
lsckyj 初级会员 发表于 2018-5-2 20:14:41 | 显示全部楼层
图片
红海行动.png
B)`K{RHG~1`T9HK}R)3MF%F.png
举报 使用道具
bowieD 金牌会员 发表于 2018-5-2 20:40:52 | 显示全部楼层
本帖最后由 bowieD 于 2018-5-2 20:42 编辑

1、你的样例复制有问题,你的样例节点选择的是第一个和第四个,所以会采集不全,应该选择第一个样例节点和第二个样例节点来做样例复制
1.png
另外需要把定位方式改成绝对定位
2.png

2、豆瓣短评有数据diy可以使用,直接添加结构相同的网址进入就能采集
《豆瓣_电影短评》

举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-3-29 15:33