样本网址:http://china.nba.com/statistics/teamstats/
问题:如何提取每年的nba球队的数据,提交类型的操作流程?



本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
| 回复

共 13 个关于本帖的回复 最后回复于 2016-11-3 16:15

沙发
Fuller 管理员 发表于 2016-11-3 07:13:59 | 只看该作者
要定义连续动作,用两个动作即可,第一个动作是逐个选择年份,第二个动作是点击提交。不用管是否是提交。具体看连续动作教程

第一个动作是连续选择条件,做定位表达式XPath的时候要注意,只定位到select就行了,不要定位到option。具体看:http://www.gooseeker.com/doc/article-224-1.html

这里有一个专门的教程,《怎样抓取下拉菜单被选择项的值

举报 使用道具
板凳
qiukaibin 新手上路 发表于 2016-11-3 09:18:02 | 只看该作者
Fuller 发表于 2016-11-3 07:13
要定义连续动作,用两个动作即可,第一个动作是逐个选择年份,第二个动作是点击提交。不用管是否是提交。具 ...

请问一下这个是select的Xpath了吗?还是Xpath定位表达式得自己写的呢?

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
地板
Fuller 管理员 发表于 2016-11-3 09:19:37 | 只看该作者
按“显示XPath”按钮得到的基本可以用,你再用“搜索”按钮测试一下,是否能定位到你想要的那个,不要定位到多个
举报 使用道具
5#
Fuller 管理员 发表于 2016-11-3 09:21:06 | 只看该作者
主要靠“显示XPath”按钮得到XPath,根据需要手工调整一下。尤其是做动作的DOM节点是在iframe内部的,一定要用“显示XPath”得到,因为GooSeeker对XPath做了一点扩展,用以跨过一层层iframe
举报 使用道具
6#
qiukaibin 新手上路 发表于 2016-11-3 09:39:53 | 只看该作者
Fuller 发表于 2016-11-3 09:21
主要靠“显示XPath”按钮得到XPath,根据需要手工调整一下。尤其是做动作的DOM节点是在iframe内部的,一定 ...

我的两个连续动作的操作步骤是这两个:

步骤二的Xpath是提交按钮的内容
之后再爬数据的时候显示匹配失败


本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
7#
Fuller 管理员 发表于 2016-11-3 10:26:40 | 只看该作者
qiukaibin 发表于 2016-11-3 09:39
我的两个连续动作的操作步骤是这两个:

步骤二的Xpath是提交按钮的内容

匹配失败是规则问题,连续动作对不对,要观察浏览器,看看动作有没有按照预期的做
举报 使用道具
8#
Fuller 管理员 发表于 2016-11-3 10:31:52 | 只看该作者
qiukaibin 发表于 2016-11-3 09:39
我的两个连续动作的操作步骤是这两个:

步骤二的Xpath是提交按钮的内容

我加载了 凯宾数据1 ,加载失败,感觉你没有对抓取内容做内容映射。要看一下基础教程《从入门到精通
举报 使用道具
9#
qiukaibin 新手上路 发表于 2016-11-3 11:05:53 | 只看该作者
就是说整理箱规则确立的问题吗?那我看看,有可能是网址匹配不到了,谢谢~

举报 使用道具
10#
qiukaibin 新手上路 发表于 2016-11-3 15:17:49 | 只看该作者
Fuller 发表于 2016-11-3 10:31
我加载了 凯宾数据1 ,加载失败,感觉你没有对抓取内容做内容映射。要看一下基础教程《从入门到精通》
...

这个是我重新设置规则后的输出语句,可以导出第一步数据,之后连续动作的应该是无法输出,它显示的是上图的语句

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 利用AI阅读和分析文本:扣子COZE记录用户反
  • 在网页片段内直观标注——以B站评论采集为
  • 利用AI阅读和分析文本:使用COZE建设游记文
  • 使用AI工具Kimi生成python代码为文本分析结
  • 苹果mac电脑安装集搜客网络爬虫软件失败的

热门用户

GMT+8, 2024-11-21 19:50