rt

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
| 回复

共 8 个关于本帖的回复 最后回复于 2016-5-10 15:35

沙发
Fuller 管理员 发表于 2016-5-9 23:28:19 | 只看该作者
这是一个下级线索,你的截图不全,下面还有一行,显示哪个整理箱的哪个抓取内容,格式是  整理箱名.抓取内容名 ,那么,你转到 创建规则 工作台,找到这个整理箱和抓取内容,把“下级线索”那个勾去掉,就删除了
举报 使用道具
板凳
tttr2_ 初级会员 发表于 2016-5-10 00:19:48 | 只看该作者
Fuller 发表于 2016-5-9 23:28
这是一个下级线索,你的截图不全,下面还有一行,显示哪个整理箱的哪个抓取内容,格式是  整理箱名.抓取内 ...

原来是这样Σ(っ °Д °;)っ,,,已经删掉了 蟹蟹~
举报 使用道具
地板
tttr2_ 初级会员 发表于 2016-5-10 00:52:21 | 只看该作者
Fuller 发表于 2016-5-9 23:28
这是一个下级线索,你的截图不全,下面还有一行,显示哪个整理箱的哪个抓取内容,格式是  整理箱名.抓取内 ...

还有个问题,,,我按视频讲解来做翻页,却总是error,不懂提示的是什么意思。。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
5#
ym 版主 发表于 2016-5-10 09:47:17 | 只看该作者
tttr2_ 发表于 2016-5-10 00:52
还有个问题,,,我按视频讲解来做翻页,却总是error,不懂提示的是什么意思。。
...

微博是js动态网页,网页结构会变的,做规则前要点击文件菜单->冻结页面->刷新网页结构,这样网页结构就不会变化,然后再来做规则映射。
举报 使用道具
6#
tttr2_ 初级会员 发表于 2016-5-10 14:23:26 | 只看该作者
ym 发表于 2016-5-10 09:47
微博是js动态网页,网页结构会变的,做规则前要点击文件菜单->冻结页面->刷新网页结构,这样网页结构就不 ...

恩恩,这么操作之后不会总出现这个error了 ヾ(o◕∀◕)ノヾ;不过做完下一页记号线索在爬数据的时候页面并没有反应诶,能帮忙看下哪里粗问题了嚒……

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
7#
Fuller 管理员 发表于 2016-5-10 14:34:25 | 只看该作者
tttr2_ 发表于 2016-5-10 14:23
恩恩,这么操作之后不会总出现这个error了 ヾ(o◕∀◕)ノヾ;不过做完下一页记号线索在爬数据的时候页面 ...

看着挺好,翻页规则名一般要与当前规则名一样,因为翻页的话,网页结构是不变的。你检查一下是否一样
举报 使用道具
8#
tttr2_ 初级会员 发表于 2016-5-10 14:53:29 | 只看该作者
Fuller 发表于 2016-5-10 14:34
看着挺好,翻页规则名一般要与当前规则名一样,因为翻页的话,网页结构是不变的。你检查一下是否一样 ...

一样的哦?……

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
9#
ym 版主 发表于 2016-5-10 15:35:43 | 只看该作者
做完爬虫路线的映射,就可以保存规则了,然后点击爬数据,就知道规则是否能成功抓到数据,如果不成功说明规则没做好,要重新映射规则再做采集测试
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 运行Apple无法验证的程序的方法
  • 文本聚类分析软件的安装和使用方法
  • 利用AI阅读和分析文本:扣子COZE记录用户反
  • 在网页片段内直观标注——以B站评论采集为
  • 利用AI阅读和分析文本:使用COZE建设游记文

热门用户

GMT+8, 2024-12-19 23:02