进行翻页设置,点击下一页,选取记号映射,再进行定位,点击DIV线索映射,定位,没反应。。。

webwxgetmsgimg.jpg (137.84 KB, 下载次数: 639)

webwxgetmsgimg.jpg
举报 使用道具
| 回复

共 11 个关于本帖的回复 最后回复于 2018-3-8 16:16

沙发
maomao 论坛元老 发表于 2018-3-8 13:45:55 | 只看该作者
网页地址?规则名?
举报 使用道具
板凳
希渺 初级会员 发表于 2018-3-8 13:49:56 | 只看该作者
maomao 发表于 2018-3-8 13:45
网页地址?规则名?

https://bj.lianjia.com/ershoufang/co32/
如何表达规则名啊。。。

举报 使用道具
地板
希渺 初级会员 发表于 2018-3-8 14:28:16 | 只看该作者
maomao 发表于 2018-3-8 13:45
网页地址?规则名?

https://bj.lianjia.com/ershoufang/co32/
对该网页里的小区、结构、户型、年代、单价等进行采集

举报 使用道具
5#
maomao 论坛元老 发表于 2018-3-8 14:48:14 | 只看该作者
希渺 发表于 2018-3-8 14:28
https://bj.lianjia.com/ershoufang/co32/
对该网页里的小区、结构、户型、年代、单价等进行采集


在爬虫路线工作台上,你能看到dom节点号会出现在红框所示位置
举报 使用道具
6#
希渺 初级会员 发表于 2018-3-8 14:57:30 | 只看该作者
maomao 发表于 2018-3-8 14:48
在爬虫路线工作台上,你能看到dom节点号会出现在红框所示位置

我先做的翻页,再做层级,所以暂时没有线索1,但是定位还是不行啊,看图

webwxgetmsgimg (1).jpg (137.74 KB, 下载次数: 633)

webwxgetmsgimg (1).jpg
举报 使用道具
7#
Fuller 管理员 发表于 2018-3-8 15:13:01 | 只看该作者
希渺 发表于 2018-3-8 14:57
我先做的翻页,再做层级,所以暂时没有线索1,但是定位还是不行啊,看图
...

做翻页规则,一定要在爬虫路线工作台上新建一个线索。线索编号1,2,3是一个顺序号,没有实质意义。如果你做了层级,又做翻页,应该是两个线索
举报 使用道具
8#
希渺 初级会员 发表于 2018-3-8 15:17:45 | 只看该作者
Fuller 发表于 2018-3-8 15:13
做翻页规则,一定要在爬虫路线工作台上新建一个线索。线索编号1,2,3是一个顺序号,没有实质意义。如果你 ...

做翻页规则,一定要在爬虫路线工作台上新建一个线索。线索编号1,2,3是一个顺序号,没有实质意义。如果你做了层级,又做翻页,应该是两个线索

衍生出两个问题:1、先做翻页,下一页标志text记号映射,点击下一页区域DIV定位映射没反应,也没出现刚才回复我的定位编号。。。
2、先做层级,再做翻页,看起来没问题,测试的结果,只有1页的数据。。。。



举报 使用道具
9#
Fuller 管理员 发表于 2018-3-8 15:33:25 | 只看该作者
希渺 发表于 2018-3-8 15:17
做翻页规则,一定要在爬虫路线工作台上新建一个线索。线索编号1,2,3是一个顺序号,没有实质意义。如果你 ...

你的意思是说连菜单都显示不出来?定位菜单下的子菜单内容是动态生成的,爬虫路线工作台上创建几个线索,菜单就生成几个项,是不是你没有创建线索?只有一个层级线索?

翻页失败的问题诊断需要你告诉我主题名是什么,我会从后台检查一下
举报 使用道具
10#
希渺 初级会员 发表于 2018-3-8 15:40:23 | 只看该作者
Fuller 发表于 2018-3-8 15:33
你的意思是说连菜单都显示不出来?定位菜单下的子菜单内容是动态生成的,爬虫路线工作台上创建几个线索, ...

对,菜单都显示不出来。刚刚对采集内容进行了标签设置,还没开始创建线索


主题名是:北京二手房-lj
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-4 20:01