快捷导航
0 3416

众筹家网站采集攻略

xandy 于 2017-1-23 15:06 发表 [复制链接]
众筹家数据DIY各页面之间的组合采集攻略如下(绿框是页面名称,橙色字体是采集结果表中的网址字段):

众筹家_众筹项目列表”和其他页面组合使用
思路
  • 该页面的“详情链接”可以作为“众筹家_众筹项目详情”的线索网址
方法
  • 从父页面数据结果表将链接拷贝出来,作为子页面的线索网址
  • 点击“输入多条网址”,就可以将网址批量粘贴进去开始运行采集了

【附注】
数据DIY某网站某页面采集到的网址,可以作为同网站其他页面的线索网址,只要和样例网址的页面结构是一样的,就可以把网址批量添加进去,从而使得各页面之间能够组合使用,发挥数据DIY最大的价值。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
| 回复

共 0 个关于本帖的回复 最后回复于 2017-1-23 15:06

您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Jupyter Notebook使用sklearn的TF-IDF算法
  • 基于TSC 理论的网络社区中知识动员模式研究
  • 网页数据采集使用嵌套整理箱获得有层次的数
  • 我国旅游管理研究的知识来源与结构—基于文
  • 面向用户评论的关键词抽取研究-以美团为例

热门用户

GMT+8, 2021-7-30 12:30