样本网址:http://china.nba.com/statistics/teamstats/
问题:如何提取每年的nba球队的数据,提交类型的操作流程?
360桌面截图20161102235812.jpg
360桌面截图20161102235824.jpg

举报 使用道具
| 回复

共 13 个关于本帖的回复 最后回复于 2016-11-3 16:15

Fuller 管理员 发表于 2016-11-3 07:13:59 | 显示全部楼层
要定义连续动作,用两个动作即可,第一个动作是逐个选择年份,第二个动作是点击提交。不用管是否是提交。具体看连续动作教程

第一个动作是连续选择条件,做定位表达式XPath的时候要注意,只定位到select就行了,不要定位到option。具体看:http://www.gooseeker.com/doc/article-224-1.html

这里有一个专门的教程,《怎样抓取下拉菜单被选择项的值

举报 使用道具
qiukaibin 新手上路 发表于 2016-11-3 09:18:02 | 显示全部楼层
Fuller 发表于 2016-11-3 07:13
要定义连续动作,用两个动作即可,第一个动作是逐个选择年份,第二个动作是点击提交。不用管是否是提交。具 ...

请问一下这个是select的Xpath了吗?还是Xpath定位表达式得自己写的呢? 123.jpg
举报 使用道具
Fuller 管理员 发表于 2016-11-3 09:19:37 | 显示全部楼层
按“显示XPath”按钮得到的基本可以用,你再用“搜索”按钮测试一下,是否能定位到你想要的那个,不要定位到多个
举报 使用道具
Fuller 管理员 发表于 2016-11-3 09:21:06 | 显示全部楼层
主要靠“显示XPath”按钮得到XPath,根据需要手工调整一下。尤其是做动作的DOM节点是在iframe内部的,一定要用“显示XPath”得到,因为GooSeeker对XPath做了一点扩展,用以跨过一层层iframe
举报 使用道具
qiukaibin 新手上路 发表于 2016-11-3 09:39:53 | 显示全部楼层
Fuller 发表于 2016-11-3 09:21
主要靠“显示XPath”按钮得到XPath,根据需要手工调整一下。尤其是做动作的DOM节点是在iframe内部的,一定 ...

我的两个连续动作的操作步骤是这两个:
23.jpg 3.jpg
步骤二的Xpath是提交按钮的内容
之后再爬数据的时候显示匹配失败


举报 使用道具
Fuller 管理员 发表于 2016-11-3 10:26:40 | 显示全部楼层
qiukaibin 发表于 2016-11-3 09:39
我的两个连续动作的操作步骤是这两个:

步骤二的Xpath是提交按钮的内容

匹配失败是规则问题,连续动作对不对,要观察浏览器,看看动作有没有按照预期的做
举报 使用道具
Fuller 管理员 发表于 2016-11-3 10:31:52 | 显示全部楼层
qiukaibin 发表于 2016-11-3 09:39
我的两个连续动作的操作步骤是这两个:

步骤二的Xpath是提交按钮的内容

我加载了 凯宾数据1 ,加载失败,感觉你没有对抓取内容做内容映射。要看一下基础教程《从入门到精通
举报 使用道具
qiukaibin 新手上路 发表于 2016-11-3 11:05:53 | 显示全部楼层
就是说整理箱规则确立的问题吗?那我看看,有可能是网址匹配不到了,谢谢~

举报 使用道具
qiukaibin 新手上路 发表于 2016-11-3 15:17:49 | 显示全部楼层
Fuller 发表于 2016-11-3 10:31
我加载了 凯宾数据1 ,加载失败,感觉你没有对抓取内容做内容映射。要看一下基础教程《从入门到精通》
...

1.jpg 这个是我重新设置规则后的输出语句,可以导出第一步数据,之后连续动作的应该是无法输出,它显示的是上图的语句

举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-18 09:20