21#
zhengqing5566 初级会员 发表于 2017-1-4 18:10:01 | 只看该作者
xandy 发表于 2017-1-4 17:40
注意,如果你自定义xpath没有写好的话,是采集不到正确的网址的,所以你要确保你在onclik值里面提取链接的 ...

嗯嗯  OK 了 批量添加到里面去了  现在在采集数据了        你说的自定义XPATH 是怎么做的呢   能不能在我的 主题里 演示下
举报 使用道具
22#
zhengqing5566 初级会员 发表于 2017-1-4 18:15:16 | 只看该作者
啾小妍SAMA 发表于 2017-1-4 17:55
晕死。上面不是说了。
用提取和组合函数将onclick值转成完整的网址后,就可以将这些网址批量添加,作为 ...

刚做出来就看到你的消息了

举报 使用道具
23#
xandy 论坛元老 发表于 2017-1-6 17:45:49 | 只看该作者
本帖最后由 xandy 于 2017-1-6 17:57 编辑
zhengqing5566 发表于 2017-1-4 18:10
嗯嗯  OK 了 批量添加到里面去了  现在在采集数据了        你说的自定义XPATH 是怎么做的呢   能不能在 ...

如果是写自定义xpath的话,比如,我抓了主胜列下数值的onclick值(链接包含在OddsHistory('')的单引号里头),那么对主胜链接的xpath可以这样写:
  1. substring-before(substring-after(.//@onclick,"OddsHistory('"),"')")
复制代码
但是,你会发现这样写xpath提示错误,因为提取函数里头带有引号,所以要用转义符来替代,不然的话xpath匹配会失败。
    1. "是对"的转义
    复制代码

    1. '是对'的转义
    复制代码

正确是写法应该如下:
  1. substring-before(substring-after(.//@onclick,"OddsHistory('"),"')")
复制代码
最后,给主胜链接勾上下级线索,目标主题名就是抓取主胜指数详情列表的规则
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 利用AI阅读和分析文本:扣子COZE记录用户反
  • 在网页片段内直观标注——以B站评论采集为
  • 利用AI阅读和分析文本:使用COZE建设游记文
  • 使用AI工具Kimi生成python代码为文本分析结
  • 苹果mac电脑安装集搜客网络爬虫软件失败的

热门用户

GMT+8, 2024-11-23 16:31