按照http://www.gooseeker.com/doc/thread-658-1-2.html试过,没有成功。
主题名:test1_miles
麻烦帮忙看看,给点建议,谢谢!
举报 使用道具
| 回复

共 10 个关于本帖的回复 最后回复于 2016-11-22 18:08

沙发
Fuller 管理员 发表于 2016-11-21 16:36:23 | 只看该作者
经查,这是程序bug造成的,正在修改程序代码,如果需要一个紧急版本,请加入qq群: 集搜客爬虫软件 481335253,与管理员联系,可以临时给你修改后的程序专门解决这个问题。因为按照开发计划,还不到发布版本的时间
举报 使用道具
板凳
mileshuo 初级会员 发表于 2016-11-21 17:48:46 | 只看该作者
Fuller 发表于 2016-11-21 16:36
经查,这是程序bug造成的,正在修改程序代码,如果需要一个紧急版本,请加入qq群: 集搜客爬虫软件 4813352 ...

谢谢,不急,可以等下个版本发布再说
举报 使用道具
地板
Fuller 管理员 发表于 2016-11-21 18:39:10 | 只看该作者
问题已经解决,如果需要,只能给你一个临时补救版本。

在“爬虫线索”工作台上定义记号线索不能翻页,这个按钮有些特殊,只能在“连续动作”工作台上定义点击动作,而且要设置“模拟点击”才行。为了持续翻页,要设置重复点击次数为-1,也就是无限点击,那么就需要设置根据重复内容中断采集那个选项
举报 使用道具
5#
mileshuo 初级会员 发表于 2016-11-21 21:33:38 | 只看该作者
Fuller 发表于 2016-11-21 18:39
问题已经解决,如果需要,只能给你一个临时补救版本。

在“爬虫线索”工作台上定义记号线索不能翻页,这个 ...

通过连续动作的话,定位表达式该怎么写呢?Xpath还没搞明白
举报 使用道具
6#
mileshuo 初级会员 发表于 2016-11-21 21:40:14 | 只看该作者
mileshuo 发表于 2016-11-21 21:33
通过连续动作的话,定位表达式该怎么写呢?Xpath还没搞明白

用绝对定位试了下,收到了下边的错误提示

Image 2.png (3.72 KB, 下载次数: 888)

错误提示

错误提示
举报 使用道具
7#
Fuller 管理员 发表于 2016-11-21 21:44:00 | 只看该作者
mileshuo 发表于 2016-11-21 21:33
通过连续动作的话,定位表达式该怎么写呢?Xpath还没搞明白

XPath的基础知识需要在百度上查一些资料。在教程首页搜索“自定义XPath”,也能看到很多材料。

很多时候不用手工写,MS谋数台的“显示XPath”按钮(看下图中间最左边的按钮)就是产生XPath表达式的。这个定位到“下一页”按钮的XPath应该这么写
  1. //*[@class='page_button' and  @value='下一页']<context>//*[@id='famebody']</context>
复制代码
集搜客扩展了XPath,增加了<context>标签,代表iframe/frame框架。


上图还要设置模拟点击,按钮的点击有点特别,需要勾上模拟点击
举报 使用道具
8#
mileshuo 初级会员 发表于 2016-11-22 17:40:43 | 只看该作者
Fuller 发表于 2016-11-21 21:44
XPath的基础知识需要在百度上查一些资料。在教程首页搜索“自定义XPath”,也能看到很多材料。

很多时候 ...

按这个方法试了,还是没能翻页,只抓了第一页后,浏览器就显示空白了,日志里有错误提示,如图:

Image 2.png (4.66 KB, 下载次数: 881)

Image 2.png
举报 使用道具
9#
Fuller 管理员 发表于 2016-11-22 17:55:14 | 只看该作者
mileshuo 发表于 2016-11-22 17:40
按这个方法试了,还是没能翻页,只抓了第一页后,浏览器就显示空白了,日志里有错误提示,如图:

...

你的xpath是什么?似乎是xpath写的不对

如果需要临时版本,需要加入qq群,专门给你传一个
举报 使用道具
10#
mileshuo 初级会员 发表于 2016-11-22 18:01:37 | 只看该作者
Fuller 发表于 2016-11-22 17:55
你的xpath是什么?似乎是xpath写的不对

如果需要临时版本,需要加入qq群,专门给你传一个

Xpath是照您那个复制的

//*[@class='page_button' and  @value='下一页']<context>//*[@id='famebody']</context>
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-2 23:29