爬去文件下载过后,如果内容页有多图,图片文件名会单独一行列出来,现在我想把文件名他们合并,上传到数据库,怎么办,同时网页片段爬去的图片文件名,和下载的图片文件名不一样,怎么修改


举报 使用道具
| 回复

共 4 个关于本帖的回复 最后回复于 2018-12-7 14:12

沙发
czj19961023 实习版主 发表于 2018-12-7 14:06:25 | 只看该作者
参照这个教程操作excel匹配图片
举报 使用道具
板凳
czj19961023 实习版主 发表于 2018-12-7 14:07:08 | 只看该作者
在结果文件中,会有专门一个字段保存文件名,文件名不一样不用担心, 一定能对应上。
你的数据要入库,这是个问题。刚才你看到的那个文章只是说在excel中怎么匹配图片,入库需要你写个程序,把爬下来的xml文件和图片都存入数据库,利用xml文件中的图片名字把他们匹配起来。

举报 使用道具
地板
RTNULL 初级会员 发表于 2018-12-7 14:11:17 | 只看该作者

批量导入文件已经完成了,就是上图片中这个路径怎样匹配下图片路径,我想直接通过excel上传到数据库,不在直接导入xml
上下图的两个字段怎样把路径匹配下,我已经把图片匹配到excel里了,但是我想上传到数据库上,但是怎样通过把图片名字匹配内容页的图片路径上




举报 使用道具
5#
czj19961023 实习版主 发表于 2018-12-7 14:12:09 | 只看该作者
RTNULL 发表于 2018-12-7 14:11
批量导入文件已经完成了,就是上图片中这个路径怎样匹配下图片路径,我想直接通过excel上传到数据库,不在 ...

要上传数据库得写程序。在excel中,看起来图片都有了,本质上图片并没有放在excel中,只是一个链接。你不可能把一个excel导入数据库就能连图也存进去了


举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-20 19:04