问:有高手在吗 请教这种点击日历表翻页的怎么抓取啊

如果网址本身就是这种只是后面的日期改变的 /jingcai/?date=2015-12-17 而当前页面的代码中又没有页面地址 能通过相对线索搞定翻页吗?


答:翻页抓取是很简单的,可以用记号线索相对线索类型。选日期是个难点,如果网址中有日期,就构造网址


问:怎么构造呢?

答:比如上面那个网址,date=2015-12-17 这段可以替换成你要的日期的,这样可以构造一批网址,在会员中心添加线索

问:会员中心?就是个人账户里面吗?

哪个选项啊 我看了一遍没看到有添加线索的项目


答:在爬虫管理那里,可以添加线索,看这个教程:http://www.gooseeker.com/doc/article-172-1.html

会员中心会有很多强大的功能逐步发布出来,大家要熟悉会员中心里面的功能。


主要这两项,第一个是对爬虫的管理,比如,线索管理,入库,调度等等;第二个是购买的资源或者你要发布出来赚积分的资源

举报 使用道具
| 回复

共 0 个关于本帖的回复 最后回复于 2015-12-20 21:24

您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-20 15:23