只能爬第一页的,不知道是规则问题还是网速差的原因
举报 使用道具
| 回复

共 12 个关于本帖的回复 最后回复于 2017-11-7 16:38

沙发
Fuller 管理员 发表于 2017-11-2 22:35:40 | 只看该作者
你选了“文本记号”,那么不能用空格做记号,要选择一个很有特点的代表“下一页”的文字
举报 使用道具
板凳
Fuller 管理员 发表于 2017-11-2 22:42:26 | 只看该作者
像我这样:不用文本记号,而是用代表翻页的那个A的class作为记号。

举报 使用道具
地板
Matthew123 初级会员 发表于 2017-11-7 11:10:18 | 只看该作者
还是不行,第一页可以进行到底,但从第二页开始进行到一半就卡掉了,后面也是这样。
举报 使用道具
5#
umsung 高级会员 发表于 2017-11-7 11:28:23 | 只看该作者
Matthew123 发表于 2017-11-7 11:10
还是不行,第一页可以进行到底,但从第二页开始进行到一半就卡掉了,后面也是这样。 ...

你规则都没有改过来 ,记号值还是个空的,当然会不行,照着回复内容把记号线索的记号值叫上就好了。
举报 使用道具
6#
Matthew123 初级会员 发表于 2017-11-7 11:36:05 | 只看该作者
umsung 发表于 2017-11-7 11:28
你规则都没有改过来 ,记号值还是个空的,当然会不行,照着回复内容把记号线索的记号值叫上就好了。
...

我重新改了一下规则:genetics,但还是不行
举报 使用道具
7#
Matthew123 初级会员 发表于 2017-11-7 11:40:18 | 只看该作者
还有这个规则:fanyeshizhua,还是一样的问题抓取到第二页快要结束的部分直接到最底,无法进行下去,第一页还是正常的
举报 使用道具
8#
bowieD 金牌会员 发表于 2017-11-7 14:25:14 | 只看该作者
本帖最后由 bowieD 于 2017-11-7 14:41 编辑

仔细看Fuller的回复内容,图片上都标的很清楚,用@class=next-page switch 这个@class值做记号映射,而你用的class=icon,当然翻不了页。第二个规则也是一样。

34.jpg (106.28 KB, 下载次数: 805)

34.jpg
举报 使用道具
9#
Matthew123 初级会员 发表于 2017-11-7 15:08:53 | 只看该作者
我现在修改了规则:neglected3,但还是会出现上面的问题,可以翻到第二页,可是进行不下去。在第二页要结束的部分卡住我抓去的是http://journals.plos.org/plosntds/search?filterJournals=PLoSNTD&resultsPerPage=60&q=(author_affiliate%3Abrazil)+AND%20publication_date%3A%5B2007-01-01T00%3A00%3A00Z%20TO%202016-12-31T23%3A59%3A59Z%5D&page=1
举报 使用道具
10#
Matthew123 初级会员 发表于 2017-11-7 15:10:32 | 只看该作者
bowieD 发表于 2017-11-7 14:25
仔细看Fuller的回复内容,图片上都标的很清楚,用@class=next-page switch 这个@class值做记号映射,而你用 ...

可以帮忙看一下吗,感谢ing
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-6 11:32