网址:http://apps.webofknowledge.com/full_record.do?product=UA&search_mode=GeneralSearch&qid=3&SID=4EmEmtD6fdIoqSs6TuC&page=1&doc=1
我只想要摘要(abstract)数据,通过翻页爬下一页的摘要数据,搜索结果共有250440条,帮我爬出100000条就足够了。。。
学生党,300块求帮忙。。。谢啦!
举报 使用道具
| 回复

共 12 个关于本帖的回复 最后回复于 2017-3-6 16:42

沙发
davidfang 新手上路 发表于 2017-3-6 15:39:38 | 只看该作者
有意愿的联系qq:1656413071
举报 使用道具
板凳
quyixuan 金牌会员 发表于 2017-3-6 15:44:37 | 只看该作者
这个规则很简单的,就单纯做一个翻页规则就行了,可以一直翻页,你完全可以自己做的
举报 使用道具
地板
davidfang 新手上路 发表于 2017-3-6 15:46:47 | 只看该作者
quyixuan 发表于 2017-3-6 15:44
这个规则很简单的,就单纯做一个翻页规则就行了,可以一直翻页,你完全可以自己做的 ...

我试了,可不行哎。。
举报 使用道具
5#
quyixuan 金牌会员 发表于 2017-3-6 15:50:05 | 只看该作者
davidfang 发表于 2017-3-6 15:46
我试了,可不行哎。。

不行是什么问题,翻页失败了还是怎么

举报 使用道具
6#
davidfang 新手上路 发表于 2017-3-6 15:51:52 | 只看该作者
quyixuan 发表于 2017-3-6 15:50
不行是什么问题,翻页失败了还是怎么

翻页总是失败,只能抓到第一页的数据。。我用scopus也试了下。。能不能加下你qq?
举报 使用道具
7#
quyixuan 金牌会员 发表于 2017-3-6 15:55:10 | 只看该作者
davidfang 发表于 2017-3-6 15:51
翻页总是失败,只能抓到第一页的数据。。我用scopus也试了下。。能不能加下你qq?
...

你照着翻页的教程来做,里面就有这种情况的翻页,不应该会出问题的

举报 使用道具
8#
davidfang 新手上路 发表于 2017-3-6 15:57:27 | 只看该作者
quyixuan 发表于 2017-3-6 15:55
你照着翻页的教程来做,里面就有这种情况的翻页,不应该会出问题的

我就是照着天猫那个翻页教程做的。。。
举报 使用道具
9#
quyixuan 金牌会员 发表于 2017-3-6 16:05:00 | 只看该作者
你这个网页的翻页标志不是“下一页”,是一个三角符号,参照这个来
http://www.gooseeker.com/doc/thread-658-1-2.html
举报 使用道具
10#
HJLing 版主 发表于 2017-3-6 16:06:20 | 只看该作者
建议不要做翻页线索
每一页都有独立网址
你去excel批量生成这些网址
然后作为线索添加进去就好了
这样还可以用爬虫群同时采集
避免翻页中断
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-4 10:24