像text很容易理解是文字值
1、 DIV, TABLE, TR,TD,TH,A都是什么意思啊?
2、有些字段前有@符号,例如@class @id @onkeydown 是什么意思?
3、有的词前面有 + ,#  例如+attributes,   #test  是什么意思 这些符号有什么特殊的用处?
举报 使用道具
| 回复

共 3 个关于本帖的回复 最后回复于 2016-1-23 20:53

沙发
xandy 论坛元老 发表于 2016-1-23 20:40:06 | 只看该作者
像div、table、tr、td这样的是HTML(超文本标记语言)里头的标签,通过这些标记来显示网页中的各个部分。各个标签的含义详看这里:http://www.w3school.com.cn/tags/tag_div.asp

可以不用把所有的标签弄懂,但要明白的是网页上的内容是通过这些来显示的,所以我们采集的时候要进行定位,找到相应节点才能找到存放在这些节点上的内容,而这些内容可能就是你想要的。
举报 使用道具
板凳
Fuller 管理员 发表于 2016-1-23 20:53:29 | 只看该作者
html标签前面没有别的符号

属性前面有@

+attributes 不是html标准里面的,是GooSeeker软件自己起的名字,表示把一组属性组合在一起放在+attributes里面

#text就是html中的text
举报 使用道具
地板
gdzxLyzh 初级会员 发表于 2016-1-23 20:53:47 | 只看该作者
这条解释的很好 ,谢谢,懂了
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 运行Apple无法验证的程序的方法
  • 文本聚类分析软件的安装和使用方法
  • 利用AI阅读和分析文本:扣子COZE记录用户反
  • 在网页片段内直观标注——以B站评论采集为
  • 利用AI阅读和分析文本:使用COZE建设游记文

热门用户

GMT+8, 2024-12-19 16:59