我新发布了一个采集规则:
领英搜索结果抓取


详细信息:
领英搜索结果抓取

希望大家喜欢!下载地址:
http://www.gooseeker.com/res/detail_321626.html
举报 使用道具
| 回复

共 4 个关于本帖的回复 最后回复于 2018-3-30 09:17

沙发
anniescy 新手上路 发表于 2018-3-30 07:00:28 | 只看该作者
运行该规则后错误。
线索编号:11043354
加载抓取规则遇到的错误:
无法定位容器 No.0
无法定位抓取内容 No.1 (情景2);XPath是.//*[@class=distance-badge ember-view]/text()[position()=3]
无法定位抓取内容 No.3 (情景2);XPath是text()[position()=3]
无法定位抓取内容 No.4 (情景2);XPath是.//*[@class=search-result__result-link loading disabled ember-view]/@id
无法定位抓取内容 No.5 (情景2);XPath是.//*[@class=search-result__result-link loading disabled ember-view]/@data-control-name

加载爬虫路线遇到的错误:
无法定位网页内容,基于XPath://*[.//text()=下一页 and @class=results-paginator ember-view]
无法定位线索0;定位用XPath:<context>//*[.//text()=下一页 and @class=results-paginator ember-view]</context>。跳过!
举报 使用道具
板凳
anniescy 新手上路 发表于 2018-3-30 07:00:51 | 只看该作者
接上:
无法定位网页内容,基于XPath://*[.//text()=下一页 and @class=results-paginator ember-view]
无法定位记号
经检查,记号(下一页)不符合要求,原因:节点号不正确
举报 使用道具
地板
maomao 论坛元老 发表于 2018-3-30 07:12:14 | 只看该作者
anniescy 发表于 2018-3-30 07:00
接上:
无法定位网页内容,基于XPath://*[.//text()=下一页 and @class=results-paginator ember-view]
无 ...

规则可能失效了,等技术检查一下,改好了,通知你
举报 使用道具
5#
scraper 论坛元老 发表于 2018-3-30 09:17:47 | 只看该作者
anniescy 发表于 2018-3-30 07:00
接上:
无法定位网页内容,基于XPath://*[.//text()=下一页 and @class=results-paginator ember-view]
无 ...

可以重新下载更新一下试试
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 利用AI阅读和分析文本:扣子COZE记录用户反
  • 在网页片段内直观标注——以B站评论采集为
  • 利用AI阅读和分析文本:使用COZE建设游记文
  • 使用AI工具Kimi生成python代码为文本分析结
  • 苹果mac电脑安装集搜客网络爬虫软件失败的

热门用户

GMT+8, 2024-11-24 00:10