请问,我想抓取列表信息的页面,就是一堆标题,然后再从标题的url进入到网页正文中,抓取全文。可是在抓取列表信息的页面中,发现标题的url不是完整的网址,href 是显示   ./t1300906.shtml  这种情况下该怎么做下级线索呢  谢谢大家
举报 使用道具
| 回复

共 2 个关于本帖的回复 最后回复于 2016-4-8 16:39

沙发
Fuller 管理员 发表于 2016-4-8 16:18:31 | 只看该作者
不用担心,下级线索会自动补齐网址
举报 使用道具
板凳
wangjsuccess 新手上路 发表于 2016-4-8 16:39:52 | 只看该作者
本帖最后由 wangjsuccess 于 2016-4-8 16:42 编辑
Fuller 发表于 2016-4-8 16:18
不用担心,下级线索会自动补齐网址

谢谢,会自动补齐啊,好智能啊。我再试试看,因为我没有提取出下级信息,所以我以为是这个href不全的问题呢,我再操作试试,看看行不行。谢谢亲,有问题再回来骚扰,哈哈。
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-20 00:15