11#
Fuller 管理员 发表于 2016-12-7 14:32:53 | 只看该作者
zhuohui1987 发表于 2016-12-7 14:13
有发现线索,测试正常,但是抓取的时候网页的白,xml里面没有抓到信息

你的第一级没有勾选关键内容,你检查一下
举报 使用道具
12#
Fuller 管理员 发表于 2016-12-7 14:42:30 | 只看该作者
三明预售_2 这个规则一定要切成两个,这个只做点击,下一个是点击后抓取 幢信息
举报 使用道具
13#
zhuohui1987 金牌会员 发表于 2016-12-7 16:11:18 | 只看该作者
Fuller 发表于 2016-12-7 14:42
三明预售_2 这个规则一定要切成两个,这个只做点击,下一个是点击后抓取 幢信息 ...

三明预售_2  这个规则一定要切成两个,我已经切的  还空白采集。包括浏览器为空白
举报 使用道具
14#
Fuller 管理员 发表于 2016-12-7 16:16:31 | 只看该作者
zhuohui1987 发表于 2016-12-7 16:11
三明预售_2  这个规则一定要切成两个,我已经切的  还空白采集。包括浏览器为空白
...

切成两个以后,这个 三明预售_2 不要创建两个整理箱,不要 许可列表 ,另外,在整理箱上一定要勾选关键内容,至少要把“小区信息”这个抓取内容勾上关键内容
举报 使用道具
15#
zhuohui1987 金牌会员 发表于 2016-12-7 17:09:14 | 只看该作者
Fuller 发表于 2016-12-7 16:16
切成两个以后,这个 三明预售_2 不要创建两个整理箱,不要 许可列表 ,另外,在整理箱上一定要勾选关键内 ...

在做一个规则,获取不到链接
举报 使用道具
16#
Fuller 管理员 发表于 2016-12-7 17:10:49 | 只看该作者
zhuohui1987 发表于 2016-12-7 17:09
在做一个规则,获取不到链接

你想获取哪个链接?点击 幢信息 位置,是ajax的,不能获取链接,只能点击
举报 使用道具
17#
zhuohui1987 金牌会员 发表于 2016-12-7 17:16:11 | 只看该作者
Fuller 发表于 2016-12-7 17:10
你想获取哪个链接?点击 幢信息 位置,是ajax的,不能获取链接,只能点击
...

点击 幢信息 位置,是ajax的  获取title里面东西就可以啊,ajax 获取id 我构造一链接
举报 使用道具
18#
zhuohui1987 金牌会员 发表于 2016-12-7 17:17:50 | 只看该作者
Fuller 发表于 2016-12-7 16:16
切成两个以后,这个 三明预售_2 不要创建两个整理箱,不要 许可列表 ,另外,在整理箱上一定要勾选关键内 ...

切成两个以后,两个规则不行, 放在一起也不行,用两个整理箱也不行
举报 使用道具
19#
scraper 论坛元老 发表于 2016-12-7 17:24:23 | 只看该作者
zhuohui1987 发表于 2016-12-7 17:17
切成两个以后,两个规则不行, 放在一起也不行,用两个整理箱也不行

你讲一下 你的采集流程吧
哪个页面开始 要采什么 怎么到另一个页面
截图 顺便附上网址说说看

举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-28 10:13