本帖最后由 柳华芳 于 2017-3-2 17:08 编辑

我在北 大 法 宝上搜索相关的主题的文件,之后出来搜索结果列表,我想把搜索列表中的内容爬下来,但是搜索之后的网址与初始网址一样,爬虫在采集时打开的是初始网址,而不是搜索结果列表。这种情况要怎么办啊?
举报 使用道具
| 回复

共 1 个关于本帖的回复 最后回复于 2017-3-2 17:10

沙发
ym 版主 发表于 2017-3-2 17:10:31 | 只看该作者
这种搜索结果没有独立网址的网页,要用连续动作设置自动输入关键词然后搜索,再来采集搜索结果的数据,操作参考教程《连续动作:自动搜索关键词采集信息》
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-5 01:27