抓取的时候,有一个点进去是连接的符号(就是这个圈中的A),我要怎么抓取这个字母呢?

253X}YC8XD4EX%_}{{FZ8GW.png (2.84 KB, 下载次数: 632)

253X}YC8XD4EX%_}{{FZ8GW.png
举报 使用道具
| 回复

共 3 个关于本帖的回复 最后回复于 2017-12-29 15:03

沙发
wyi_飞翔 新手上路 发表于 2017-12-20 21:30:10 | 只看该作者
链接,不是连接。求教!
举报 使用道具
板凳
maomao 论坛元老 发表于 2017-12-20 21:59:01 | 只看该作者
wyi_飞翔 发表于 2017-12-20 21:30
链接,不是连接。求教!

在GS浏览器中加载这个网页,进入“定义规则”模式,界面下部就会显示DOM窗口,点击这个A,看看DOM窗口中定位到哪个节点。别看显示成A,很有可能根本没有这个A字母,很可能用某个DOM节点的class值代表这个A。比如,京东商品的评论,大家打分给的3颗星或者5颗星,就是用class值控制的。

如果是这样,把这个class值采集下来,把采集结果导入到excel中后,把这个class值替换成A

举报 使用道具
地板
wyi_飞翔 新手上路 发表于 2017-12-29 15:03:13 | 只看该作者
maomao 发表于 2017-12-20 21:59
在GS浏览器中加载这个网页,进入“定义规则”模式,界面下部就会显示DOM窗口,点击这个A,看看DOM窗口中定 ...

谢谢大佬,第一次用这个软件,我去好好学习一下再试试,非常感谢!
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-6 11:18