这里边的登陆成功标志,是如何确定?

登陆界面点击登陆之后,自动跳转至这一页面。只是原来的“登陆”变成了用户名。

举报 使用道具
| 回复

共 11 个关于本帖的回复 最后回复于 2016-9-26 09:14

沙发
Fuller 管理员 发表于 2016-9-22 16:55:40 | 只看该作者
登录成功的话,一般会在网页的右上角出现你的用户名,可以把这个当成登录成功标志,写一个xpath
举报 使用道具
板凳
2445406817 中级会员 发表于 2016-9-22 17:20:30 | 只看该作者
Fuller 发表于 2016-9-22 16:55
登录成功的话,一般会在网页的右上角出现你的用户名,可以把这个当成登录成功标志,写一个xpath ...

查到这个text的路径是//*[@class='jzbtn']/text(),那我写成//*[@class='jzbtn']/text='用户名' 这个格式正确吗?
举报 使用道具
地板
Fuller 管理员 发表于 2016-9-22 17:21:29 | 只看该作者
2445406817 发表于 2016-9-22 17:20
查到这个text的路径是//*[@class='jzbtn']/text(),那我写成//*[@class='jzbtn']/text='用户名' 这个格式 ...

不正确,应该是
  1. //*[@class='jzbtn']/text()[contains(.,'用户名')]
复制代码
举报 使用道具
5#
Fuller 管理员 发表于 2016-9-22 17:23:37 | 只看该作者
注意,上面我写的那个xpath是定位到text,如果你需要定位到text的父节点,而且这个父节点有@class='jzbtn'的话,那么需要这样写:
  1. //*[@class='jzbtn' and contains(text(),'用户名')]
复制代码
举报 使用道具
6#
2445406817 中级会员 发表于 2016-9-22 17:49:05 | 只看该作者
Fuller 发表于 2016-9-22 17:23
注意,上面我写的那个xpath是定位到text,如果你需要定位到text的父节点,而且这个父节点有@class='jzbtn' ...

调度中心自动登录设置都写好了,而且也验证写对了。为什么还是不能自动登陆?登陆是有个专门的页面的,在调度中也没有输入网址呀。这个没关系吗?
举报 使用道具
7#
Fuller 管理员 发表于 2016-9-22 18:04:15 | 只看该作者
2445406817 发表于 2016-9-22 17:49
调度中心自动登录设置都写好了,而且也验证写对了。为什么还是不能自动登陆?登陆是有个专门的页面的,在 ...

会员中心那个调度过程是针对一种单一情况,比如,像微博登录,不会有另外一个专门的登录窗口。复杂情况可以选择以下两个方案之一:

1)如果有专门的登录窗口,建议使用crontab来控制,具体参看:http://www.gooseeker.com/doc/article-92-1.html

2)如果登录过程十分复杂,建议使用连续动作
举报 使用道具
8#
Fuller 管理员 发表于 2016-9-22 18:04:57 | 只看该作者
用自己编写的crontab吧,比会员中心多了一个输入项:登录页网址
举报 使用道具
9#
Fuller 管理员 发表于 2016-9-22 18:05:53 | 只看该作者
一定需要自动登录吗?预先手工在浏览器中登录好,再运行爬虫。这种方式是否能接受?这是最简便的
举报 使用道具
10#
2445406817 中级会员 发表于 2016-9-22 18:20:22 | 只看该作者
Fuller 发表于 2016-9-22 18:05
一定需要自动登录吗?预先手工在浏览器中登录好,再运行爬虫。这种方式是否能接受?这是最简便的 ...

详情页有很多,在浏览器中预先登录,只是暂时性的登陆。在爬的过程中需要不停的手工登陆,感觉很麻烦。那我再看看crontab的内容吧,之前看过教程,感觉都涉及到编程了,看起来太复杂了。心累。
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-27 05:28