如图所示,采集主题名、回复内容需要样例复制,但是用户名只有一个,不需要样例复制,应该怎么处理呢?  
举报 使用道具
| 回复

共 7 个关于本帖的回复 最后回复于 2017-7-6 14:06

沙发
maomao 论坛元老 发表于 2017-7-6 08:01:16 | 只看该作者
不太明白你的意思,一个用户名是什么意思?把你要采集的东西完整截图出来,看一看。
举报 使用道具
板凳
axu517 中级会员 发表于 2017-7-6 08:41:06 | 只看该作者
maomao 发表于 2017-7-6 08:01
不太明白你的意思,一个用户名是什么意思?把你要采集的东西完整截图出来,看一看。 ...


用户名就是头像下面那个昵称:gdZJL,帖子标题需要进行样例复制,但是旁边这个昵称不需要,不知道应该怎么弄?
如果建两个容节点,会出现匹配失败,不知道规则哪边措了。。。

@8KA2C[RT2`7~]%0Y(5@A9B.png (102.86 KB, 下载次数: 680)

@8KA2C[RT2`7~]%0Y(5@A9B.png
举报 使用道具
地板
ym 版主 发表于 2017-7-6 09:34:25 | 只看该作者
因为用户名和主题是两个不同的网页模块,要分别都做上定位标志映射来精确采集范围,这样规则的适用性就更强了,参考教程《定位标志精确采集范围》
举报 使用道具
5#
shengchengx 金牌会员 发表于 2017-7-6 09:44:12 | 只看该作者
axu517 发表于 2017-7-6 08:41
用户名就是头像下面那个昵称:gdZJL,帖子标题需要进行样例复制,但是旁边这个昵称不需要,不知道应该怎 ...

先看你这个规则也没有报错呢,是还有什么问题么?
举报 使用道具
6#
axu517 中级会员 发表于 2017-7-6 13:53:10 | 只看该作者
ym 发表于 2017-7-6 09:34
因为用户名和主题是两个不同的网页模块,要分别都做上定位标志映射来精确采集范围,这样规则的适用性就更强 ...

翻完前两页就显示匹配失败,不再继续翻页 了。

WYG7Z_2LDWC9WYIR`XJZ{F1.png (121.23 KB, 下载次数: 674)

采集的时候翻完前两页就不能再采集数据了,显示匹配失败

采集的时候翻完前两页就不能再采集数据了,显示匹配失败
举报 使用道具
7#
axu517 中级会员 发表于 2017-7-6 13:54:27 | 只看该作者
shengchengx 发表于 2017-7-6 09:44
先看你这个规则也没有报错呢,是还有什么问题么?

就是想帖子标题跟用户昵称同时采集,但是测试结果可以,采集的时候就老是显示匹配失败

举报 使用道具
8#
ym 版主 发表于 2017-7-6 14:06:26 | 只看该作者
前面两页能采到数据,应该不是整理箱的问题,可能是翻页有问题,你参考这篇教程提到的方法检查一下《翻页到中间就失败了怎么解决》
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-2 19:19