linkedin的数据可以抓取吗?
举报 使用道具
| 回复

共 4 个关于本帖的回复 最后回复于 2016-12-28 15:08

沙发
xandy 论坛元老 发表于 2016-12-28 15:03:11 | 只看该作者
可以的,小白入门可以先看这篇教程:《采集网页数据
举报 使用道具
板凳
曾经也是小何 初级会员 发表于 2016-12-28 15:04:22 | 只看该作者
xandy 发表于 2016-12-28 15:03
可以的,小白入门可以先看这篇教程:《采集网页数据》

那需要登录会员吗?
举报 使用道具
地板
xandy 论坛元老 发表于 2016-12-28 15:06:26 | 只看该作者

如果不登录也可以看全信息,那么可以不用登录。
如果登录后才能看全信息,那么在定义规则之前先在浏览器登录,同时运行DS打数机在采集数据的同时也要确保浏览器中linkedin是登录状态的。
举报 使用道具
5#
xandy 论坛元老 发表于 2016-12-28 15:08:26 | 只看该作者

另外,在采集的过程中如果碰到弹验证码的问题,弹的不频繁的话,就直接在DS打数机输入验证码,确定后DS会继续采集。
如果弹的频繁的话,可以调用集搜客的自动打码功能,以后碰到验证码就会自动输入验证码了,介绍文档参看:《加强网络爬虫装备:连发弹仓、飞掠模式、连续打码功能介绍》。
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-13 15:20