已经阿里巴巴商家联系方式页的网址全部采集到,我找了其中的一个商家的联系方式页新建了一个任务,准备其他网址均采用这个模式进行采集,但采集任务启动后采集不到数据,请大家帮忙指点一下。
举报 使用道具
| 回复

共 4 个关于本帖的回复 最后回复于 2021-12-13 18:04

沙发
lyf2019 初级会员 发表于 2021-5-2 17:44:34 | 只看该作者

这个是联系方式页面的网址
联系方式网址对应有联系人、联系电话等字段。
两者好像没有建立起有效的关联

举报 使用道具
板凳
Fuller 管理员 发表于 2021-5-2 18:26:57 | 只看该作者
你的规则名字是什么?
举报 使用道具
地板
yuhuanbin 禁止发言 发表于 2021-12-13 17:13:03 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
举报 使用道具
5#
Fuller 管理员 发表于 2021-12-13 18:04:13 | 只看该作者
yuhuanbin 发表于 2021-12-13 17:13
阿里巴巴采集商家联系方式求教程

没有专门的教程,采集规则并不难做,每个商家都有专门一个网页显示联系信息,那个网页的网址也是一样的结构,所以,得到商家的首页网址或者其他页网址以后,很容易构造出商家的联系信息页网址。

在规则中要定义一个点击动作,因为要点击一下才能采集联系方式。点击动作的教程参看:https://www.gooseeker.com/doc/article-546-1.html

采集的时候,要预先在爬虫浏览器中登录到alibaba上
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-19 22:35