这是第一级抓取的界面,找不到@herf这个节点,没办法设置内容映射呀?新手上路,还不太明白,求大神指点
11111.PNG
举报 使用道具
| 回复

共 5 个关于本帖的回复 最后回复于 2019-3-9 15:40

wangyong 版主 发表于 2019-3-9 10:47:55 | 显示全部楼层
@href属性是在A节点下,进入定位规则模式后,在列表页点一下可以进入下级的网页位置,网页标签窗口会跟动,在定位到的节点上下找一找A节点
也可以把链接发出来,我们帮你找找
举报 使用道具
Fuller 管理员 发表于 2019-3-9 11:24:54 | 显示全部楼层
把网址发出来吧,也有一些网页,没有href的,这种必须做连续点击,不能做下级线索
举报 使用道具
jupter 初级会员 发表于 2019-3-9 13:23:59 | 显示全部楼层
wangyong 发表于 2019-3-9 10:47
@href属性是在A节点下,进入定位规则模式后,在列表页点一下可以进入下级的网页位置,网页标签窗口会跟动, ...

好的,非常感谢。https://mifengcha.com/ico?type=past   就是想找这个网页上面有评分的项目。然后点开详情页再搜集里面具体的分数是怎么样的。
6ace29902f622d2ef0f6b8eb70968c1.png

点开之后搜集下面圈出来的数据
a8e552ff6ad08acbb1d9411701e5e17.png




举报 使用道具
jupter 初级会员 发表于 2019-3-9 13:26:09 | 显示全部楼层
Fuller 发表于 2019-3-9 11:24
把网址发出来吧,也有一些网页,没有href的,这种必须做连续点击,不能做下级线索 ...

连续点击这个有教程吗?
这个是我要搜集数据的网址: https://mifengcha.com/ico?type=past
非常感谢

举报 使用道具
Fuller 管理员 发表于 2019-3-9 15:40:31 | 显示全部楼层
jupter 发表于 2019-3-9 13:26
连续点击这个有教程吗?
这个是我要搜集数据的网址: https://mifengcha.com/ico?type=past
非常感谢

这个是纯动态的页面,详情页没有href网址,要连续点击,点击以后还会弹出一个新窗口,需要用到旗舰版的功能:飞掠模式,抓取弹窗中的内容。跟这篇教程《采集百度百家号文章》一样
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-19 06:53