想采集这个网址https://db.yaozh.com/instruct 里的 药品名称,然后查看里面的图片,并以名称保存。

举报 使用道具
| 回复

共 2 个关于本帖的回复 最后回复于 2018-5-8 16:52

wonemin 新手上路 发表于 2018-5-8 16:48:23 | 显示全部楼层
有没有人回复一下,是不是需要做两个规则,第一个规则采集药品名称,第二个规则下载图片
举报 使用道具
数据集 高级会员 发表于 2018-5-8 16:52:29 | 显示全部楼层
本帖最后由 数据集 于 2018-5-8 17:05 编辑

可以采集
1、定义一级规则,制作翻页线索,同时在一级规则里定义连续点击动作点击查看按钮,目标主题名对应到第二级规则主题名,

2、定义二级规则采集药品名称,同时用样例复制采集下载图片,同时定义连续点击动作点击退出按钮,目标主题名对应到一级规则主题名
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-3-29 17:21