翻页和层级抓取中的问题

希渺

我要抓取https://bj.lianjia.com/ershoufang/co32/网页中今天添加的新房源信息，例如，小区、户型、面积、结构、年代、单价等，先通过层级抓取到该网页中各个链接的地址，然后进行翻页设置，测试结果只有1页的信息，这是为什么啊？
有两个问题：1、如果只抓取前5页的地址，有什么方法设定吗？
2、通过层级抓取到网页中各个链接的地址后，我还需要对各个链接里的例如挂牌时间、成交时间这些字段进行抓取的话，应该怎么做啊？
谢谢！

数据集 · 发表于 2018-3-9 17:37:57

1，需要只抓取前5页的地址，需要用爬虫群采集，在爬虫群的调度设置中可以设置只翻五页。
2，用层级采集，一级采集列表页的链接后给二级规则，二级规则再采集详情页的信息，要采集什么就映射什么。

翻页和层级抓取中的问题

共 1 个关于本帖的回复最后回复于 2018-3-9 17:37

本帖子中包含更多资源

推荐板块

精彩推荐

热门话题

热门用户

	B Color Image Link Quote Code Smilies 高级模式您需要登录后才可以回帖登录 \| 立即注册回帖并转播回帖后跳转到最后一页

翻页和层级抓取中的问题

共 1 个关于本帖的回复 最后回复于 2018-3-9 17:37

本帖子中包含更多资源

推荐板块

精彩推荐

热门话题

热门用户

共 1 个关于本帖的回复最后回复于 2018-3-9 17:37