rt

20160509222326.png (17.96 KB, 下载次数: 706)

20160509222326.png
举报 使用道具
| 回复

共 8 个关于本帖的回复 最后回复于 2016-5-10 15:35

沙发
Fuller 管理员 发表于 2016-5-9 23:28:19 | 只看该作者
这是一个下级线索,你的截图不全,下面还有一行,显示哪个整理箱的哪个抓取内容,格式是  整理箱名.抓取内容名 ,那么,你转到 创建规则 工作台,找到这个整理箱和抓取内容,把“下级线索”那个勾去掉,就删除了
举报 使用道具
板凳
tttr2_ 初级会员 发表于 2016-5-10 00:19:48 | 只看该作者
Fuller 发表于 2016-5-9 23:28
这是一个下级线索,你的截图不全,下面还有一行,显示哪个整理箱的哪个抓取内容,格式是  整理箱名.抓取内 ...

原来是这样Σ(っ °Д °;)っ,,,已经删掉了 蟹蟹~
举报 使用道具
地板
tttr2_ 初级会员 发表于 2016-5-10 00:52:21 | 只看该作者
Fuller 发表于 2016-5-9 23:28
这是一个下级线索,你的截图不全,下面还有一行,显示哪个整理箱的哪个抓取内容,格式是  整理箱名.抓取内 ...

还有个问题,,,我按视频讲解来做翻页,却总是error,不懂提示的是什么意思。。

无标题error1.png (236.5 KB, 下载次数: 710)

无标题error1.png

无标题error2.png (282.07 KB, 下载次数: 737)

无标题error2.png
举报 使用道具
5#
ym 版主 发表于 2016-5-10 09:47:17 | 只看该作者
tttr2_ 发表于 2016-5-10 00:52
还有个问题,,,我按视频讲解来做翻页,却总是error,不懂提示的是什么意思。。
...

微博是js动态网页,网页结构会变的,做规则前要点击文件菜单->冻结页面->刷新网页结构,这样网页结构就不会变化,然后再来做规则映射。
举报 使用道具
6#
tttr2_ 初级会员 发表于 2016-5-10 14:23:26 | 只看该作者
ym 发表于 2016-5-10 09:47
微博是js动态网页,网页结构会变的,做规则前要点击文件菜单->冻结页面->刷新网页结构,这样网页结构就不 ...

恩恩,这么操作之后不会总出现这个error了 ヾ(o◕∀◕)ノヾ;不过做完下一页记号线索在爬数据的时候页面并没有反应诶,能帮忙看下哪里粗问题了嚒……

翻页线索规则?.png (183.16 KB, 下载次数: 713)

翻页线索规则?.png
举报 使用道具
7#
Fuller 管理员 发表于 2016-5-10 14:34:25 | 只看该作者
tttr2_ 发表于 2016-5-10 14:23
恩恩,这么操作之后不会总出现这个error了 ヾ(o◕∀◕)ノヾ;不过做完下一页记号线索在爬数据的时候页面 ...

看着挺好,翻页规则名一般要与当前规则名一样,因为翻页的话,网页结构是不变的。你检查一下是否一样
举报 使用道具
8#
tttr2_ 初级会员 发表于 2016-5-10 14:53:29 | 只看该作者
Fuller 发表于 2016-5-10 14:34
看着挺好,翻页规则名一般要与当前规则名一样,因为翻页的话,网页结构是不变的。你检查一下是否一样 ...

一样的哦?……

翻页线索规则2?.png (83.21 KB, 下载次数: 674)

翻页线索规则2?.png
举报 使用道具
9#
ym 版主 发表于 2016-5-10 15:35:43 | 只看该作者
做完爬虫路线的映射,就可以保存规则了,然后点击爬数据,就知道规则是否能成功抓到数据,如果不成功说明规则没做好,要重新映射规则再做采集测试
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-19 14:27