11#
zhengqing5566 初级会员 发表于 2017-1-4 16:58:27 | 只看该作者
xandy 发表于 2017-1-4 16:39
要采集多条数据也是正常样例复制就可以了,对TR进行样例复制,如下图所示:

...

嗯嗯我做了  样例复制 了 两个主题名分别叫   打开主胜赔率     赔率提取            我先点的打开主胜赔率   的  单搜   再点的 赔率提取   的集痩      结果出现网页不存在  而且 赔率提取里只提取了一家的赔率
举报 使用道具
12#
zhengqing5566 初级会员 发表于 2017-1-4 17:17:03 | 只看该作者
xandy 发表于 2017-1-4 16:39
要采集多条数据也是正常样例复制就可以了,对TR进行样例复制,如下图所示:

...

主题    打开主胜赔率    使用单搜  竟然说打不开主页   事实上网页是能打开的
举报 使用道具
13#
xandy 论坛元老 发表于 2017-1-4 17:23:38 | 只看该作者
zhengqing5566 发表于 2017-1-4 17:17
主题    打开主胜赔率    使用单搜  竟然说打不开主页   事实上网页是能打开的
...

不要对点击如此契而不舍了,前面说了可以抓链接来实现为什么要点击呢?
举报 使用道具
14#
zhengqing5566 初级会员 发表于 2017-1-4 17:26:25 | 只看该作者
xandy 发表于 2017-1-4 17:23
不要对点击如此契而不舍了,前面说了可以抓链接来实现为什么要点击呢?
...

没有用点击呢   就是把 链接映射到下一级
举报 使用道具
15#
zhengqing5566 初级会员 发表于 2017-1-4 17:27:48 | 只看该作者
xandy 发表于 2017-1-4 17:23
不要对点击如此契而不舍了,前面说了可以抓链接来实现为什么要点击呢?
...


本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
16#
xandy 论坛元老 发表于 2017-1-4 17:40:21 | 只看该作者
本帖最后由 xandy 于 2017-1-4 17:46 编辑
zhengqing5566 发表于 2017-1-4 17:26
没有用点击呢   就是把 链接映射到下一级

注意,如果你自定义xpath没有写好的话,是采集不到正确的网址的,所以你要确保你在onclik值里面提取链接的xpath要写对来。


举报 使用道具
17#
zhengqing5566 初级会员 发表于 2017-1-4 17:42:23 | 只看该作者
xandy 发表于 2017-1-4 17:40
提取onclick括号里的内容,如果自定义xpath写不对的话,你可以这样——
做两个规则:
如下图,规则1抓列表 ...

我这怎么显示 网页不存在
举报 使用道具
18#
xandy 论坛元老 发表于 2017-1-4 17:43:51 | 只看该作者
本帖最后由 xandy 于 2017-1-4 17:48 编辑
zhengqing5566 发表于 2017-1-4 17:42
我这怎么显示 网页不存在

提取onclick括号里的内容,如果自定义xpath写不对的话,你可以这样——
做两个规则:
如下图,规则1抓列表里面的信息,其中包含了每个公司主胜值里头的onclick值,不要给onclick勾下级线索,因为没有自定义xpath,所以抓到的是一个字符串(这样的话Onlick原本是什么值抓到的就是什么值)。

然后对规则1产生的结果文件进行处理,用excel对onclick值的那一列进行批量函数处理,如下图所示:


用提取和组合函数将onclick值转成完整的网址后,就可以将这些网址批量添加,作为下一个规则的线索,来抓赔率变化记录。
参看:《如何管理规则的线索

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
19#
zhengqing5566 初级会员 发表于 2017-1-4 17:52:20 | 只看该作者
xandy 发表于 2017-1-4 17:43
提取onclick括号里的内容,如果自定义xpath写不对的话,你可以这样——
做两个规则:
如下图,规则1抓列表 ...

你说 不把 onclick  勾选下级链接   那么   我第二级的主题  用什么来自动去抓取  第一级主题呢   他们两个通过什么来关联
举报 使用道具
20#
啾小妍SAMA 初级会员 发表于 2017-1-4 17:55:07 | 只看该作者
zhengqing5566 发表于 2017-1-4 17:52
你说 不把 onclick  勾选下级链接   那么   我第二级的主题  用什么来自动去抓取  第一级主题呢   他们两 ...

晕死。上面不是说了。
用提取和组合函数将onclick值转成完整的网址后,就可以将这些网址批量添加,作为下一个规则的线索,来抓赔率变化记录。参看:《如何管理规则的线索

举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 利用AI阅读和分析文本:扣子COZE记录用户反
  • 在网页片段内直观标注——以B站评论采集为
  • 利用AI阅读和分析文本:使用COZE建设游记文
  • 使用AI工具Kimi生成python代码为文本分析结
  • 苹果mac电脑安装集搜客网络爬虫软件失败的

热门用户

GMT+8, 2024-11-23 17:12