请问,我想抓取列表信息的页面,就是一堆标题,然后再从标题的url进入到网页正文中,抓取全文。可是在抓取列表信息的页面中,发现标题的url不是完整的网址,href 是显示   ./t1300906.shtml  这种情况下该怎么做下级线索呢  谢谢大家
举报 使用道具
| 回复

共 2 个关于本帖的回复 最后回复于 2016-4-8 16:39

沙发
Fuller 管理员 发表于 2016-4-8 16:18:31 | 只看该作者
不用担心,下级线索会自动补齐网址
举报 使用道具
板凳
wangjsuccess 新手上路 发表于 2016-4-8 16:39:52 | 只看该作者
本帖最后由 wangjsuccess 于 2016-4-8 16:42 编辑
Fuller 发表于 2016-4-8 16:18
不用担心,下级线索会自动补齐网址

谢谢,会自动补齐啊,好智能啊。我再试试看,因为我没有提取出下级信息,所以我以为是这个href不全的问题呢,我再操作试试,看看行不行。谢谢亲,有问题再回来骚扰,哈哈。
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 运行Apple无法验证的程序的方法
  • 文本聚类分析软件的安装和使用方法
  • 利用AI阅读和分析文本:扣子COZE记录用户反
  • 在网页片段内直观标注——以B站评论采集为
  • 利用AI阅读和分析文本:使用COZE建设游记文

热门用户

GMT+8, 2024-12-19 22:47