隐藏列表(就是要点击才会打开的带有链接的数据)的数据怎么抓取呀
举报 使用道具
| 回复

共 3 个关于本帖的回复 最后回复于 2015-10-8 23:26

gooseeker_info 金牌会员 发表于 2015-10-7 22:27:51 | 显示全部楼层
模拟点击应该可以,发给样本页面出来看看
举报 使用道具
luolam 初级会员 发表于 2015-10-8 16:50:31 | 显示全部楼层
http://www.okooo.com/livecenter/jingcai/?date=2015-10-06这是样本页面的链接,[img]C:\Users\luolam\Desktop\9S%5B7QK%5D3LA[ZBWFTUUU$A6H.png[/img],我想以日期对应的链接作为下级线索,然后继续抓取下级内容。手工构造可以可以抓取到日期,但是不能作为下级线索。麻烦你帮忙看下,谢谢啦
举报 使用道具
Fuller 管理员 发表于 2015-10-8 23:26:50 | 显示全部楼层
luolam 发表于 2015-10-8 16:50
http://www.okooo.com/livecenter/jingcai/?date=2015-10-06这是样本页面的链接,,我想以日期对应的链接作 ...

不用管这是第几级线索,只管选一个页面作为样本页面,做好抓取规则,然后在DS打数机中选中这个主题,右键菜单有“添加”线索功能,把构造的网址一条条录入进去。

http://www.okooo.com/livecenter/jingcai/?date=2015-10-05
http://www.okooo.com/livecenter/jingcai/?date=2015-10-04
http://www.okooo.com/livecenter/jingcai/?date=2015-10-03

这个规律太明显了,这样构造下去就行了
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-3-29 15:03