本帖最后由 leixiaola 于 2016-10-27 17:52 编辑

请教抓取隐藏的@style元素

如图所示
需求是i抓取天猫店铺的小图,但是小图在@style中,无法直接提取
请问有什么办法可以抓取到这个url地址呢

举报 使用道具
| 回复

共 10 个关于本帖的回复 最后回复于 2016-10-28 12:03

沙发
shenzhenwan10 金牌会员 发表于 2016-10-27 17:50:49 | 只看该作者
自己写个xpath
举报 使用道具
板凳
shenzhenwan10 金牌会员 发表于 2016-10-27 17:51:20 | 只看该作者
如果在dom可以找到,就直接做内容映射就可以
举报 使用道具
地板
leixiaola 金牌会员 发表于 2016-10-27 17:52:38 | 只看该作者
shenzhenwan10 发表于 2016-10-27 17:51
如果在dom可以找到,就直接做内容映射就可以

dom里面找不到这个元素,无法直接内容映射。
xpath并不是很会写,请大神请教,多谢

举报 使用道具
5#
ym 版主 发表于 2016-10-27 17:52:44 | 只看该作者
@style节点是存在html里的,只是MS谋数台没有解析出来,对于这种隐藏的网页信息节点,就不能直接做映射,只能通过自定义xpath来采集。
xpath可以百度教程来学习,也可以在集搜客教程里搜索相关文章来学习。
举报 使用道具
6#
leixiaola 金牌会员 发表于 2016-10-27 17:53:25 | 只看该作者
ym 发表于 2016-10-27 17:52
@style节点是存在html里的,只是MS谋数台没有解析出来,对于这种隐藏的网页信息节点,就不能直接做映射,只 ...

请大神指教这个xpath要怎么写呢???拜托
举报 使用道具
7#
Fuller 管理员 发表于 2016-10-27 18:00:31 | 只看该作者
这种隐藏的节点,写自定义xpath的时候,必须使用专用定位,定位表达式用DOM上有的节点(在自定义xpath直接做内容映射也是用DOM上有的节点),内容表达式就编一个抓取@style的。

自定义xpath的教程和讨论都可以在教程首页搜索“自定义xpath”得到:http://www.gooseeker.com/tuto/tu ... AE%9A%E4%B9%89xpath
举报 使用道具
8#
leixiaola 金牌会员 发表于 2016-10-27 18:11:20 | 只看该作者
xpath正在学习中,但是对于这种隐藏的dom如何精准抓取真是被难道了
有没有大神提供案例对应xpath,不胜感激,欢迎私信
举报 使用道具
9#
leixiaola 金牌会员 发表于 2016-10-27 18:14:53 | 只看该作者
我写了一个//*[@class='tm-clear J_TSaleProp tb-img     ']/li[position()=2]
但是抓到的是i文字,不是url 这个要怎么改呢
举报 使用道具
10#
Fuller 管理员 发表于 2016-10-27 18:30:05 | 只看该作者
leixiaola 发表于 2016-10-27 18:14
我写了一个//*[@class='tm-clear J_TSaleProp tb-img     ']/li
但是抓到的是i文字,不是url 这个要怎么改 ...

规则名是什么?我加载上来帮你看看
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 运行Apple无法验证的程序的方法
  • 文本聚类分析软件的安装和使用方法
  • 利用AI阅读和分析文本:扣子COZE记录用户反
  • 在网页片段内直观标注——以B站评论采集为
  • 利用AI阅读和分析文本:使用COZE建设游记文

热门用户

GMT+8, 2024-12-19 11:40