规则一:广州本田-1
规则二:广州本田-2

现在设置的规则一中的两个连续动作定位表达式如图所示,执行结果只能采集到上海地区。根据采集的数据看,省份在变化,但是城市一直是上海,不知道哪里的问题,请高手指点,谢谢!

11.png (110.7 KB, 下载次数: 602)

省份定位表达式

省份定位表达式

22.png (110.28 KB, 下载次数: 641)

城市定位表达式

城市定位表达式
举报 使用道具
| 回复

共 7 个关于本帖的回复 最后回复于 2019-8-5 19:05

沙发
wangyong 版主 发表于 2019-8-5 15:57:16 | 只看该作者
选择类型的语句要定位到select选择省份:
  1. //*[@id='optProvinceMap']
复制代码
选择城市:
  1. //*[@id='optCityMap']
复制代码

举报 使用道具
板凳
Thinking2019 初级会员 发表于 2019-8-5 15:58:04 | 只看该作者
一开始就是这两个代码
举报 使用道具
地板
Thinking2019 初级会员 发表于 2019-8-5 15:58:19 | 只看该作者
采集的时候一样的
举报 使用道具
5#
Fuller 管理员 发表于 2019-8-5 16:47:16 | 只看该作者
Thinking2019 发表于 2019-8-5 15:58
采集的时候一样的

很多设计精美的网页都不会用html的select,而是用自己设计的样式来展示的,那么select中的内容只是用来存选项,用爬虫选select没有用。而是要用一系列点击动作实现一个select过程


比如,上图,要先点击那一条,就能显示出来一个列表,再点击列表中的某一项。就完成了一个选择操作。



上图可见,选项其实是在div中的。为了做这样的规则,在工具条中间有个选择框“内容定位”,不要勾,点击那条选择条,就能看到下拉选项显示出来了,然后鼠标不要动,按alt键,就能看到选中了“规则”菜单,点击向下箭头键,用箭头键选择“冻结页面”,只有冻结以后,鼠标就可以动了,下拉选项就冻结在那里,再次勾上“内容定位”,就可以点选下拉选项了。为他们定义xpath,作为点击目标
举报 使用道具
6#
wangyong 版主 发表于 2019-8-5 17:08:54 | 只看该作者
选择省份的步骤分拆成了两步,
1,点击出省份的下拉框
  1. //*[@class='simulateSelect-select']
复制代码

2,点击选择每个省份
  1. //*[@class='simulateSelect selectProvinces active']//*[@class='selectList']/p
复制代码
举报 使用道具
7#
wangyong 版主 发表于 2019-8-5 17:11:10 | 只看该作者

点击省份的步骤里要把高级设置里的模拟点击给取消
举报 使用道具
8#
wangyong 版主 发表于 2019-8-5 19:05:39 | 只看该作者
1,点击省份下拉框
  1. //*[@class='simulateSelect selectProvinces']//*[@class='simulateSelect-select']
复制代码


2,逐个点击每个省份(高级设置取消模拟点击)
  1. //*[@class='simulateSelect selectProvinces active']//*[@class='selectList']/p
复制代码


3,点击城市下拉框
  1. //*[contains(@class,'simulateSelect selectCity')]//*[@class='simulateSelect-select']
复制代码


4,逐个点击每个城市(高级设置取消模拟点击)
  1. //*[@class='simulateSelect selectCity active']//*[@class='selectList']/p
复制代码


举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-19 19:46