最后登录 1970-1-1
您需要 登录 才可以下载或查看,没有帐号?立即注册
最后登录 2024-12-20
Fuller 发表于 2016-4-25 17:45 给一个样本微博网址,我们看看视频url在哪里,你可以截个图,圈一下视频的位置 ...
yanland 发表于 2016-4-25 22:06 带有话题的微博,比如这个, ,它的页面标签是 现在我抓只能抓到第一个A的href标签,但是我是想抓后面两 ...
Fuller 发表于 2016-4-25 22:18 这是在自由文本中的超链接,自由文本是没有结构的,你不知道到底有几个A,而且排列规律是怎样的,所以, ...
shenzhenwan9 发表于 2016-4-28 14:25 清洗程序是对爬取下来的结果文件内容进行处理 同一段信息,不同的人可能需要其中的不同部分,这个是需要你 ...
yanland 发表于 2016-4-28 14:44 那可以直接在创建规则的时候使用正则表达式过滤呢
Fuller 发表于 2016-4-28 15:47 创建规则的时候,可以用xpath的函数 substring-after(), substring-before()做一些处理,但是处理能力有 ...
发表回复 回帖并转播 回帖后跳转到最后一页
GMT+8, 2024-12-22 00:46
共 9 个关于本帖的回复 最后回复于 2016-4-28 22:07