快捷导航
怎样采集人民日报图文数据库也就是人民日报的历史数据?
举报 使用道具
| 回复

共 6 个关于本帖的回复 最后回复于 2022-1-6 17:55

wangyong 版主 发表于 2021-3-17 11:41:35 | 显示全部楼层
在集搜客快捷采集中输入链接可以直接采集到数据。
使用方法如下:
1,安装集搜客数据管家,从左侧工具条进入快捷采集,选择访问人民日报图文数据库_列表采集
输入要采集的节点关键词搜索链接,例如搜索“大数据”后的链接:http://data.people.com.cn/rmrb/s ... o=1&pageSize=50
数据管家-人民日报.png
确认提交后数据管家会自动开始采集,采集完成后,我们可以在快捷采集后台中找到该任务下载数据
下载到列表的数据,包括关键词、标题、链接、发布时间、摘要、文章关键词。
2,要继续采集到新闻详情,需要将详情链接添加到人民日报图文数据库_详情采集,添加多条网址可以选择输入多条网址按钮
人民日报详情添加.png
添加完成后数据管家会自动开始采集,详情任务采集完成后,打包下载就可以看到新闻数据内容了
这是采集到的数据
人民日报数据库数据Excel.png

举报 使用道具
吴吴 新手上路 发表于 2022-1-6 11:44:21 | 显示全部楼层
为什么我的老是停止?是要登录人民日报的数据库才能采集嘛
举报 使用道具
小蜜蜂测试171 初级会员 发表于 2022-1-6 13:15:24 | 显示全部楼层
吴吴 发表于 2022-1-6 11:44
为什么我的老是停止?是要登录人民日报的数据库才能采集嘛

采集多了的情况下需要登录账号
举报 使用道具
Fuller 管理员 发表于 2022-1-6 14:51:06 | 显示全部楼层
吴吴 发表于 2022-1-6 11:44
为什么我的老是停止?是要登录人民日报的数据库才能采集嘛

需要登录的,你得有账号和密码才行。在运行爬虫任务之前,在爬虫浏览器中预先登录这个网站
举报 使用道具
吴吴 新手上路 发表于 2022-1-6 17:28:35 | 显示全部楼层
Fuller 发表于 2022-1-6 14:51
需要登录的,你得有账号和密码才行。在运行爬虫任务之前,在爬虫浏览器中预先登录这个网站
...

请问这个账号怎么才能注册呀?在网上买的账号都不行
举报 使用道具
Fuller 管理员 发表于 2022-1-6 17:55:42 | 显示全部楼层
吴吴 发表于 2022-1-6 17:28
请问这个账号怎么才能注册呀?在网上买的账号都不行

怎么注册,可能需要联系一下人民日报网站
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 在Jupyter Notebook中将分词结果转换成数组
  • 在Jupyter Notebook中使用word2vec和k-mean
  • 网络评价对水产品线上销量影响的实证分析—
  • “中坚青年”压力与动力转化的—以高校青年
  • “抖音”短视频文本里的新生代婆媳关系

热门用户

GMT+8, 2022-1-25 03:18