网址:http://www.yuechuangyuexin.cn/f/achieve/achieveList
当翻页到358和359这二页时有问题,此问题是他网站本身出现的bug,以及输入框也是无效,URL也是统一的,我想取从360页开始的数据,请问有什么好方法,及操作步骤和相应的教程,谢谢!
举报 使用道具
| 回复

共 15 个关于本帖的回复 最后回复于 2017-7-12 14:48

沙发
shengchengx 金牌会员 发表于 2017-5-12 12:00:37 | 只看该作者
这边可以先从尾页开始,先做点击动作,翻到尾页,从尾页开始翻页抓取数据,用上一页做标志,应该就可以采集到了
举报 使用道具
板凳
johson 初级会员 发表于 2017-7-12 11:06:57 | 只看该作者
主题名:创新成果列表
举报 使用道具
地板
shengchengx 金牌会员 发表于 2017-7-12 11:35:33 | 只看该作者
johson 发表于 2017-7-12 11:06
主题名:创新成果列表

规则做错的,你应该做一个规则,做连续动作,点击到最后一页,然后目标主题名填列表页的规则,然后在列表页用上一页做翻页记号值,不能手动输入记号值的。

举报 使用道具
5#
johson 初级会员 发表于 2017-7-12 11:42:32 | 只看该作者
我做了一个:点到尾页 的连续动作
举报 使用道具
6#
johson 初级会员 发表于 2017-7-12 11:44:43 | 只看该作者
我理解的是第一步是先执行 点击动作到尾页,点到尾页后所要抓取的页面才有显示“上一页”的标记号。就是不知道怎么弄
举报 使用道具
7#
johson 初级会员 发表于 2017-7-12 11:48:16 | 只看该作者
现在是打开始抓取数据后,第一步变成了线索一执行抓取第1页,抓取完第1页后,才点击 尾页,点完尾页后就 不执行了,显示抓取完成。请问下怎么调整
举报 使用道具
8#
shengchengx 金牌会员 发表于 2017-7-12 11:54:39 | 只看该作者
johson 发表于 2017-7-12 11:48
现在是打开始抓取数据后,第一步变成了线索一执行抓取第1页,抓取完第1页后,才点击 尾页,点完尾页后就 不 ...

单独做一个规则,里面是连续动作,点击到尾页就好了,连续动作的目标规则是列表页。
然后列表页规则是用最后一页的网站做样本页,做好翻页,用上一页做翻页记号就行了

举报 使用道具
9#
johson 初级会员 发表于 2017-7-12 13:55:26 | 只看该作者
shengchengx 发表于 2017-7-12 11:54
单独做一个规则,里面是连续动作,点击到尾页就好了,连续动作的目标规则是列表页。
然后列表页规则是用 ...

单独做规则是要新建工作台新创建规则吗?
举报 使用道具
10#
johson 初级会员 发表于 2017-7-12 13:59:13 | 只看该作者
新建规则:保存提示:整理箱不能为空,请添加抓取内容
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-3 20:52