本帖最后由 jaguarzls 于 2017-8-8 23:30 编辑

本人参考往期培训《【24】连续动作采集知网文献》、《【34】知网精确采集1》和《【35】知网精确采集2》定义规则一和规则二,用于搜集知网主题名为“纳税人满意度”的所有作者、单位、发表时间等信息。按照理论上来说,加上主题名后的,应该是289篇,但实际用规则去爬取的时候,却是7100多万篇,也就是与不加主题名结果一样。
为再次检查我制定的规则是否有误,我特意在论坛里买了知网搜索的几个规则(知网_搜索62399、知网_搜索结果62399、知网_文章数据更多62399、知网_文章数据62399、知网162399和知网262399),对比一下,和我制定的没有差别,运行结果也是一样,加不加关键词没有作用,也就是说连续动作失效。
在此,向群里的大牛赐教,还望指点迷津。
文末附上截图(前四张是知网搜索RULE1和两张是知网搜索RULE2):












知网搜索RULE1_0.png (246.83 KB, 下载次数: 543)

知网搜索RULE1_0.png
举报 使用道具
| 回复

共 12 个关于本帖的回复 最后回复于 2017-8-9 15:32

沙发
shengchengx 金牌会员 发表于 2017-8-9 09:50:44 | 只看该作者
是修改过了么,我这边加载测试的时候是没有问题的呢
举报 使用道具
板凳
jaguarzls 初级会员 发表于 2017-8-9 10:20:13 | 只看该作者
没有修改啊。
举报 使用道具
地板
shengchengx 金牌会员 发表于 2017-8-9 10:25:46 | 只看该作者

你这边测试的时候还是有问题的么,你看下你关系图,有没有其他的规则给它添加线索呢,我这边连续动作都正常运行,采集结果也是对的呢
举报 使用道具
5#
jaguarzls 初级会员 发表于 2017-8-9 10:35:37 | 只看该作者
换了台电脑,知网_搜索62399运行正确了。但我的知网搜索RULE1还是不行,烦请帮忙看看,问题出在哪里?有劳了,拜托了!
举报 使用道具
6#
shengchengx 金牌会员 发表于 2017-8-9 11:04:25 | 只看该作者
jaguarzls 发表于 2017-8-9 10:35
换了台电脑,知网_搜索62399运行正确了。但我的知网搜索RULE1还是不行,烦请帮忙看看,问题出在哪里?有劳 ...

就如果你最开始说的话,搜索结果有7100多万条的话应该就是连续动作没有执行呢,我这边测试的时候是没问题的,我看你连续动作是没有问题的,但是选择主题这个动作只是点击开了下拉框,没有做选择,可是这边默认是主题,所以测试的时候这个倒没事,你测试的时候看看连续动作在运行没有,看下是没有运行,还是运行错误,看下打数机上面怎么显示的

举报 使用道具
7#
jaguarzls 初级会员 发表于 2017-8-9 11:27:41 | 只看该作者
本帖最后由 jaguarzls 于 2017-8-9 11:30 编辑

感谢大侠及时回复。
请问我选择主题哪里错了?怎么没有选择啊?
我在高级设置里,起点设置为1(主题是第一项选择),跨度设置为8,错在哪里?
另外,运行了还是那样。
附上两图。

C:\Users\Administrator\Desktop\主题选择.png
C:\Users\Administrator\Desktop\搜索.png
举报 使用道具
8#
shengchengx 金牌会员 发表于 2017-8-9 11:38:13 | 只看该作者
jaguarzls 发表于 2017-8-9 11:27
感谢大侠及时回复。
请问我选择主题哪里错了?怎么没有选择啊?
我在高级设置里,起点设置为1(主题是第一 ...

那这样的话选择动作是没问题的,但这个是没有做关键词搜索的结果呢
举报 使用道具
9#
shengchengx 金牌会员 发表于 2017-8-9 11:42:08 | 只看该作者
jaguarzls 发表于 2017-8-9 11:27
感谢大侠及时回复。
请问我选择主题哪里错了?怎么没有选择啊?
我在高级设置里,起点设置为1(主题是第一 ...


看下图1和图2,这就是开始连续动作,执行了连续动作,然后点击检索之后将页面传给了第二个规则来做采集的,你看下在你的电脑上是怎么运行 的呢

举报 使用道具
10#
jaguarzls 初级会员 发表于 2017-8-9 15:23:28 | 只看该作者
是啊,非常奇怪,我这里还是运行不起来。还是没有起到检索的作用。
会不会是爬虫程序版本问题?
我现在的是免费版?
会不会专业版才可以?
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-9 04:45