集搜客可以用来采集网站上的邮箱么,不是网页上的
举报 使用道具
| 回复

共 8 个关于本帖的回复 最后回复于 2017-3-2 10:20

沙发
ym 版主 发表于 2017-3-2 10:18:00 | 只看该作者
能通过浏览器直接浏览到这些邮箱信息的话,就可以抓取
举报 使用道具
板凳
xoen@163 初级会员 发表于 2017-3-2 10:18:21 | 只看该作者
我想要提取网页上每个网站对应的邮箱,可以的吗
举报 使用道具
地板
ym 版主 发表于 2017-3-2 10:19:07 | 只看该作者
不好做,因为一个爬虫程序只适用于一个类型的网页结构,如果您要采集无限量的网站的话,就得做无限量个爬虫程序,太费人工成本了
举报 使用道具
5#
xoen@163 初级会员 发表于 2017-3-2 10:19:19 | 只看该作者
是一个网站内,比方说谷歌浏览器,我要搜集鞋子,一个页面上有100家鞋子的网站,那我怎么提取这100家网站上的邮箱。这个可以吗
举报 使用道具
6#
ym 版主 发表于 2017-3-2 10:19:28 | 只看该作者
邮箱是显示在搜索结果中,还是要点击进入网站内才可以看到?
举报 使用道具
7#
xoen@163 初级会员 发表于 2017-3-2 10:19:38 | 只看该作者
要点进去网站才可以看到
举报 使用道具
8#
ym 版主 发表于 2017-3-2 10:20:01 | 只看该作者
这种也要对每一个点进去的网站做爬虫程序,因为各个网站的网页结构都不一样,无法用一个通用的程序去提取到所有网站的邮箱信息
举报 使用道具
9#
xoen@163 初级会员 发表于 2017-3-2 10:20:18 | 只看该作者
哦,好
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-5 00:51