12 15436

翻页问题,medicine123

Matthew123 于 2017-11-2 22:22 发表 [复制链接]
只能爬第一页的,不知道是规则问题还是网速差的原因
举报 使用道具
| 回复

共 12 个关于本帖的回复 最后回复于 2017-11-7 16:38

Fuller 管理员 发表于 2017-11-2 22:35:40 | 显示全部楼层
jihaobuneng20171102223416.png 你选了“文本记号”,那么不能用空格做记号,要选择一个很有特点的代表“下一页”的文字
举报 使用道具
Fuller 管理员 发表于 2017-11-2 22:42:26 | 显示全部楼层
像我这样:不用文本记号,而是用代表翻页的那个A的class作为记号。
buyongwenben20171102224122.png
举报 使用道具
Matthew123 初级会员 发表于 2017-11-7 11:10:18 | 显示全部楼层
还是不行,第一页可以进行到底,但从第二页开始进行到一半就卡掉了,后面也是这样。
举报 使用道具
umsung 高级会员 发表于 2017-11-7 11:28:23 | 显示全部楼层
Matthew123 发表于 2017-11-7 11:10
还是不行,第一页可以进行到底,但从第二页开始进行到一半就卡掉了,后面也是这样。 ...

你规则都没有改过来 ,记号值还是个空的,当然会不行,照着回复内容把记号线索的记号值叫上就好了。
举报 使用道具
Matthew123 初级会员 发表于 2017-11-7 11:36:05 | 显示全部楼层
umsung 发表于 2017-11-7 11:28
你规则都没有改过来 ,记号值还是个空的,当然会不行,照着回复内容把记号线索的记号值叫上就好了。
...

我重新改了一下规则:genetics,但还是不行
举报 使用道具
Matthew123 初级会员 发表于 2017-11-7 11:40:18 | 显示全部楼层
还有这个规则:fanyeshizhua,还是一样的问题抓取到第二页快要结束的部分直接到最底,无法进行下去,第一页还是正常的
举报 使用道具
bowieD 金牌会员 发表于 2017-11-7 14:25:14 | 显示全部楼层
本帖最后由 bowieD 于 2017-11-7 14:41 编辑

仔细看Fuller的回复内容,图片上都标的很清楚,用@class=next-page switch 这个@class值做记号映射,而你用的class=icon,当然翻不了页。第二个规则也是一样。
34.jpg
举报 使用道具
Matthew123 初级会员 发表于 2017-11-7 15:08:53 | 显示全部楼层
我现在修改了规则:neglected3,但还是会出现上面的问题,可以翻到第二页,可是进行不下去。在第二页要结束的部分卡住我抓去的是http://journals.plos.org/plosntds/search?filterJournals=PLoSNTD&resultsPerPage=60&q=(author_affiliate%3Abrazil)+AND%20publication_date%3A%5B2007-01-01T00%3A00%3A00Z%20TO%202016-12-31T23%3A59%3A59Z%5D&page=1
举报 使用道具
Matthew123 初级会员 发表于 2017-11-7 15:10:32 | 显示全部楼层
bowieD 发表于 2017-11-7 14:25
仔细看Fuller的回复内容,图片上都标的很清楚,用@class=next-page switch 这个@class值做记号映射,而你用 ...

可以帮忙看一下吗,感谢ing
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-17 01:31