快捷导航
4 713

领英搜索结果抓取

shengchengx 于 2018-3-20 10:02 发表 [复制链接]
我新发布了一个采集规则:
领英搜索结果抓取


详细信息:
领英搜索结果抓取

希望大家喜欢!下载地址:
http://www.gooseeker.com/res/detail_321626.html
举报 使用道具
| 回复

共 4 个关于本帖的回复 最后回复于 2018-3-30 09:17

anniescy 新手上路 发表于 2018-3-30 07:00:28 | 显示全部楼层
运行该规则后错误。
线索编号:11043354
加载抓取规则遇到的错误:
无法定位容器 No.0
无法定位抓取内容 No.1 (情景2);XPath是.//*[@class=distance-badge ember-view]/text()[position()=3]
无法定位抓取内容 No.3 (情景2);XPath是text()[position()=3]
无法定位抓取内容 No.4 (情景2);XPath是.//*[@class=search-result__result-link loading disabled ember-view]/@id
无法定位抓取内容 No.5 (情景2);XPath是.//*[@class=search-result__result-link loading disabled ember-view]/@data-control-name

加载爬虫路线遇到的错误:
无法定位网页内容,基于XPath://*[.//text()=下一页 and @class=results-paginator ember-view]
无法定位线索0;定位用XPath:<context>//*[.//text()=下一页 and @class=results-paginator ember-view]</context>。跳过!
举报 使用道具
anniescy 新手上路 发表于 2018-3-30 07:00:51 | 显示全部楼层
接上:
无法定位网页内容,基于XPath://*[.//text()=下一页 and @class=results-paginator ember-view]
无法定位记号
经检查,记号(下一页)不符合要求,原因:节点号不正确
举报 使用道具
maomao 金牌会员 发表于 2018-3-30 07:12:14 | 显示全部楼层
anniescy 发表于 2018-3-30 07:00
接上:
无法定位网页内容,基于XPath://*[.//text()=下一页 and @class=results-paginator ember-view]
无 ...

规则可能失效了,等技术检查一下,改好了,通知你
举报 使用道具
scraper 金牌会员 发表于 2018-3-30 09:17:47 | 显示全部楼层
anniescy 发表于 2018-3-30 07:00
接上:
无法定位网页内容,基于XPath://*[.//text()=下一页 and @class=results-paginator ember-view]
无 ...

可以重新下载更新一下试试
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 集搜客网络爬虫使用proxy切换IP防封锁
  • 用网络爬虫软件自动下载网页上的文件
  • 怎样用爬虫爬取亚马逊商品评论?
  • 新版集搜客网络爬虫图片下载功能
  • windows高清屏幕显示模糊的解决方法

热门用户

集搜客GooSeeker网络爬虫 ( 粤ICP备11065265号-2 )

GMT+8, 2019-2-20 05:37