快捷导航
4 500

领英搜索结果抓取

shengchengx 于 2018-3-20 10:02 发表 [复制链接]
我新发布了一个采集规则:
领英搜索结果抓取


详细信息:
领英搜索结果抓取

希望大家喜欢!下载地址:
http://www.gooseeker.com/res/detail_321626.html
举报 使用道具
| 回复

共 4 个关于本帖的回复 最后回复于 2018-3-30 09:17

anniescy 新手上路 发表于 2018-3-30 07:00:28 | 显示全部楼层
运行该规则后错误。
线索编号:11043354
加载抓取规则遇到的错误:
无法定位容器 No.0
无法定位抓取内容 No.1 (情景2);XPath是.//*[@class=distance-badge ember-view]/text()[position()=3]
无法定位抓取内容 No.3 (情景2);XPath是text()[position()=3]
无法定位抓取内容 No.4 (情景2);XPath是.//*[@class=search-result__result-link loading disabled ember-view]/@id
无法定位抓取内容 No.5 (情景2);XPath是.//*[@class=search-result__result-link loading disabled ember-view]/@data-control-name

加载爬虫路线遇到的错误:
无法定位网页内容,基于XPath://*[.//text()=下一页 and @class=results-paginator ember-view]
无法定位线索0;定位用XPath:<context>//*[.//text()=下一页 and @class=results-paginator ember-view]</context>。跳过!
举报 使用道具
anniescy 新手上路 发表于 2018-3-30 07:00:51 | 显示全部楼层
接上:
无法定位网页内容,基于XPath://*[.//text()=下一页 and @class=results-paginator ember-view]
无法定位记号
经检查,记号(下一页)不符合要求,原因:节点号不正确
举报 使用道具
maomao 金牌会员 发表于 2018-3-30 07:12:14 | 显示全部楼层
anniescy 发表于 2018-3-30 07:00
接上:
无法定位网页内容,基于XPath://*[.//text()=下一页 and @class=results-paginator ember-view]
无 ...

规则可能失效了,等技术检查一下,改好了,通知你
举报 使用道具
scraper 金牌会员 发表于 2018-3-30 09:17:47 | 显示全部楼层
anniescy 发表于 2018-3-30 07:00
接上:
无法定位网页内容,基于XPath://*[.//text()=下一页 and @class=results-paginator ember-view]
无 ...

可以重新下载更新一下试试
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 大型百货商场会员画像描绘
  • 自动导入导出数据
  • 批量爬取蘑菇街商品价格、评论信息
  • 微博用户数据分析
  • 批量爬取苏宁商品价格、评论信息

热门用户

集搜客GooSeeker网络爬虫 ( 粤ICP备11065265号-2 )

GMT+8, 2018-11-17 11:08