请教一下大家:链家房源单条规则线索测试没有问题,调度出错,具体如下:

一、规则名称:


二、出错线索:


三、出错线索:
https://gz.lianjia.com/ershoufang/dongfengdong/
https://gz.lianjia.com/ershoufang/dongshankou/

多谢指教!!

举报 使用道具
| 回复

共 8 个关于本帖的回复 最后回复于 2018-10-23 20:20

沙发
dao0oad 初级会员 发表于 2018-10-23 18:52:35 | 只看该作者
补充下信息:
可能是翻页设置有问题,我时候按照这篇文章设置的翻页相对线索。
https://www.gooseeker.com/doc/article-149-1.html
举报 使用道具
板凳
dao0oad 初级会员 发表于 2018-10-23 19:04:09 | 只看该作者
通过页面分析得到的错误信息:
加载抓取规则遇到的错误:
无法定位容器 No.0

加载爬虫路线遇到的错误:
无法定位网页内容,基于XPath://*[@class='page-box house-lst-page-box']/a[count(./text())>0 and count(following-sibling::a[position()=1]/text())>0 and @class='on' and string-length(./text())>0 and string-length(following-sibling::a[position()=1]/text())>0]/text()
无法定位相对线索0的当前节点
无法定位网页内容,基于XPath://*[@class='page-box house-lst-page-box']/a[count(./text())>0 and count(preceding-sibling::a[position()=1 and @class='on']/text())>0 and string-length(preceding-sibling::a[position()=1 and @class='on']/text())>0 and string-length(./text())>0]/text()
无法定位相对线索0的下一节点
看来是翻页的问题。
举报 使用道具
地板
Fuller 管理员 发表于 2018-10-23 19:45:41 | 只看该作者
dao0oad 发表于 2018-10-23 19:04
通过页面分析得到的错误信息:
加载抓取规则遇到的错误:
无法定位容器 No.0

你的规则是不是已经修改过了?整理箱中的内容我测试都能分析成功,你给的另外两个网址我也用这个规则分析了,也都分析成功了。

我在看看翻页规则
举报 使用道具
5#
Fuller 管理员 发表于 2018-10-23 19:50:24 | 只看该作者
翻页也是成功的。如果你的电脑屏幕比较小,一定要注意把DS打数机窗口放大到满屏,因为网页上的动态内容只有在显示位置才加载。另外,打开DS打数机的自动滚屏,这个网页挺长。DS打数机菜单 配置-》滚屏参数,把滚屏次数设置成大于0的数字,我设置成2,滚屏抓取成功
举报 使用道具
6#
dao0oad 初级会员 发表于 2018-10-23 19:51:20 | 只看该作者
多谢!没改,但是过了一条。
这一条还是不行:
https://gz.lianjia.com/ershoufang/dongshankou/
举报 使用道具
7#
dao0oad 初级会员 发表于 2018-10-23 19:52:40 | 只看该作者
我用定位标志做样例复制两条都能过,我再加几条线索试试,看看是不是用定位标志做样式复制比较好。多谢  @Fuller 。
举报 使用道具
8#
dao0oad 初级会员 发表于 2018-10-23 19:55:35 | 只看该作者
Fuller 发表于 2018-10-23 19:50
翻页也是成功的。如果你的电脑屏幕比较小,一定要注意把DS打数机窗口放大到满屏,因为网页上的动态内容只有 ...

多谢!
有多个调度器的时候怎么满屏,不是只能显示一个?

举报 使用道具
9#
dao0oad 初级会员 发表于 2018-10-23 20:20:08 | 只看该作者
Fuller 发表于 2018-10-23 19:45
你的规则是不是已经修改过了?整理箱中的内容我测试都能分析成功,你给的另外两个网址我也用这个规则分析 ...

用定位标志做样式复制可以了,多谢!
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-25 05:15