我在同一主题名下建了三个规则,三个规则的网址都是同一个,怎么同时抓取三个规则的数据,并且三个规则抓取的数据在表格的同一行?
举报 使用道具
| 回复

共 10 个关于本帖的回复 最后回复于 2017-7-3 18:01

沙发
wangyong 版主 发表于 2017-7-3 15:12:38 | 只看该作者

这两种情况,是需要图一图二都抓取,还是只抓取其中的一个图?
举报 使用道具
板凳
陈恒 初级会员 发表于 2017-7-3 16:15:09 | 只看该作者
wangyong 发表于 2017-7-3 15:12
这两种情况,是需要图一图二都抓取,还是只抓取其中的一个图?

都抓取
举报 使用道具
地板
陈恒 初级会员 发表于 2017-7-3 16:26:40 | 只看该作者
wangyong 发表于 2017-7-3 15:12
这两种情况,是需要图一图二都抓取,还是只抓取其中的一个图?

图中的current version 和all versions两个块我分别做了同主题名不同的规则,可是抓取的时候只抓取了all versions这一块的规则数据,请问怎么回事?
举报 使用道具
5#
wangyong 版主 发表于 2017-7-3 16:54:05 | 只看该作者
不需要做两个规则抓,做到同一个规则里就可以
第一种方法可以选择将两个图做样例复制
第二种可以再同一个规则中分别建两个整理箱,对应两个图
举报 使用道具
6#
陈恒 初级会员 发表于 2017-7-3 17:02:34 | 只看该作者
wangyong 发表于 2017-7-3 16:54
不需要做两个规则抓,做到同一个规则里就可以
第一种方法可以选择将两个图做样例复制
第二种可以再同一个规 ...

要抓的不是图片,是文本,是要抓上面的数字,我给你的截图是对网页上要抓取文本位置的截图。该怎么办?

举报 使用道具
7#
wangyong 版主 发表于 2017-7-3 17:28:01 | 只看该作者
我指的就是截图对应的文本内容
举报 使用道具
8#
陈恒 初级会员 发表于 2017-7-3 17:35:11 | 只看该作者
wangyong 发表于 2017-7-3 17:28
我指的就是截图对应的文本内容

如果做样例复制的话,有的网页current version下面没有数字文本,如果抓取不到数据会影响all versions下面的数字文本数据抓取吗?因为我之前抓取的时候,只要current version下面没有数据,all versions下面即使有数字文本数据也抓取不到,怎么回事?

举报 使用道具
9#
wangyong 版主 发表于 2017-7-3 17:41:21 | 只看该作者
这个是之前没有做样例复制的原因,做了样例复制之后,就是没有的就为空,有的就抓下来
举报 使用道具
10#
陈恒 初级会员 发表于 2017-7-3 17:58:58 | 只看该作者
wangyong 发表于 2017-7-3 17:41
这个是之前没有做样例复制的原因,做了样例复制之后,就是没有的就为空,有的就抓下来 ...

没有的就为空,是指这一块为空,还是整个网页的数据都会变成空?另外要勾选“关键内容”吗?如果勾选了关键内容,会不会影响同一网页上需要抓取的其他数据?
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-25 17:43