11#
ayaya1212 初级会员 发表于 2016-12-23 08:38:10 | 只看该作者
Fuller 发表于 2016-12-22 21:29
就是最顶上你发的那个网址吗?我测试的都不是英文。你翻墙了?

我一打开就是这样子,我没有翻墙啊,我也不会。。。。

QQ截图20161223083629.png (644.08 KB, 下载次数: 696)

QQ截图20161223083629.png
举报 使用道具
12#
Fuller 管理员 发表于 2016-12-23 09:21:24 | 只看该作者
ayaya1212 发表于 2016-12-23 08:38
我一打开就是这样子,我没有翻墙啊,我也不会。。。。

真的很奇怪,我在办公室和家里打开都是中文的。如果是英文的,就要多做几次点击,可以在一个规则中做前面的那几个点击,点击语言按钮-点击社会招聘,进入到列表页用另一个主题。

你的GS浏览器版本是多少?V8.1.0版本升级成全中文界面了,不知道是不是跟这个有关
举报 使用道具
13#
ayaya1212 初级会员 发表于 2016-12-23 09:32:35 | 只看该作者
Fuller 发表于 2016-12-23 09:21
真的很奇怪,我在办公室和家里打开都是中文的。如果是英文的,就要多做几次点击,可以在一个规则中做前面 ...

Version=8.0.4是这个版本的,点击具体怎么做啊?
举报 使用道具
14#
ym 版主 发表于 2016-12-23 09:40:01 | 只看该作者
本帖最后由 ym 于 2016-12-23 09:41 编辑

你把爬虫更新到8.1.0吧,去官网下载最新版安装就行。
点击动作的设置可以参考《自动点击采集京东商品价格》,你要根据这个网页的实际情况去设置多个点击动作,如果点击之后的网页结构变了,那就要在中间建立新规则,把下一步点击动作设置上,以此类推,最后是才是到你做的两级规则

举报 使用道具
15#
ayaya1212 初级会员 发表于 2016-12-23 09:41:04 | 只看该作者
ym 发表于 2016-12-23 09:40
你把爬虫更新到8.1.0吧,去官网下载最新版安装就行。
点击动作的设置可以参考《自动点击采集京东商品价格》 ...

好的,我试一下

举报 使用道具
16#
ayaya1212 初级会员 发表于 2016-12-23 10:22:13 | 只看该作者
ym 发表于 2016-12-23 09:40
你把爬虫更新到8.1.0吧,去官网下载最新版安装就行。
点击动作的设置可以参考《自动点击采集京东商品价格》 ...

哪具体步骤是什么呢?比如说我要处理的网址需要点击两次,第一次点击之后网页结构变了,那步骤是:新建规则,设置点击动作——重新建立新规则,设置动作——最后建立规则,层级采集。是这个意思吗?
PS:教程里的网页结构没有变,我不怎么看的懂。。。

举报 使用道具
17#
xandy 论坛元老 发表于 2016-12-23 16:35:05 | 只看该作者
ayaya1212 发表于 2016-12-23 10:22
哪具体步骤是什么呢?比如说我要处理的网址需要点击两次,第一次点击之后网页结构变了,那步骤是:新建规 ...

我用最新版的爬虫开显示的是中文的,所以做两次点击就可以了。
思路这样:
  • 规则1,给默认页面做点击“更多”动作
  • 规则2,切换到新的页面做点击“半年以内”动作
  • 规则3,给该页面做具体的采集规则

你要注意的是,因为网页切换之后网址是不变的,而相应规则是给相应页面做的,比如规则2和规则3。
做规则2的时候,不勾选“内容定位”,切换到更多后的页面,勾选“内容定位”后再做规则,就是切换到下图后再做规则。

规则3也一样。


举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-19 08:34