快捷导航
爬去文件下载过后,如果内容页有多图,图片文件名会单独一行列出来,现在我想把文件名他们合并,上传到数据库,怎么办,同时网页片段爬去的图片文件名,和下载的图片文件名不一样,怎么修改
QQ图片20181207101307.png

举报 使用道具
| 回复

共 4 个关于本帖的回复 最后回复于 3 天前

czj19961023 实习版主 发表于 3 天前 | 显示全部楼层
参照这个教程操作excel匹配图片
举报 使用道具
czj19961023 实习版主 发表于 3 天前 | 显示全部楼层
在结果文件中,会有专门一个字段保存文件名,文件名不一样不用担心, 一定能对应上。
你的数据要入库,这是个问题。刚才你看到的那个文章只是说在excel中怎么匹配图片,入库需要你写个程序,把爬下来的xml文件和图片都存入数据库,利用xml文件中的图片名字把他们匹配起来。

举报 使用道具
RTNULL 初级会员 发表于 3 天前 | 显示全部楼层
QQ图片20181207104249.jpg
批量导入文件已经完成了,就是上图片中这个路径怎样匹配下图片路径,我想直接通过excel上传到数据库,不在直接导入xml
上下图的两个字段怎样把路径匹配下,我已经把图片匹配到excel里了,但是我想上传到数据库上,但是怎样通过把图片名字匹配内容页的图片路径上




举报 使用道具
czj19961023 实习版主 发表于 3 天前 | 显示全部楼层
RTNULL 发表于 2018-12-7 14:11
批量导入文件已经完成了,就是上图片中这个路径怎样匹配下图片路径,我想直接通过excel上传到数据库,不在 ...

要上传数据库得写程序。在excel中,看起来图片都有了,本质上图片并没有放在excel中,只是一个链接。你不可能把一个excel导入数据库就能连图也存进去了


举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • windows高清屏幕显示模糊的解决方法
  • 修改和找回密码——微信登录集搜客GooSeeke
  • 网络爬虫自动打验证码避免重复打码
  • 大型百货商场会员画像描绘
  • 自动导入导出数据

热门用户

集搜客GooSeeker网络爬虫 ( 粤ICP备11065265号-2 )

GMT+8, 2018-12-10 14:27