快捷导航
3 3310

格式化数据抓取问题

forrest62 于 2018-8-24 16:42 发表 [复制链接]
本帖最后由 forrest62 于 2018-8-24 16:49 编辑

网址:知识星球精选站 请问下,如何抓取这个网站里面的星球名字,还有阅读数,点赞数,星球价格。

这些信息是个整体,
举报 使用道具
| 回复

共 3 个关于本帖的回复 最后回复于 2018-8-28 09:52

forrest62 新手上路 发表于 2018-8-24 16:49:57 | 显示全部楼层
为什么我输入的网址,不能直接点击呢?奇怪

网址是这个,http://www.zsxq100.com/
举报 使用道具
Fuller 管理员 发表于 2018-8-24 19:34:06 | 显示全部楼层
forrest62 发表于 2018-8-24 16:49
为什么我输入的网址,不能直接点击呢?奇怪

网址是这个,http://www.zsxq100.com/ ...

点赞20180824193304.png

要采集这些内容吗?在DOM上都分别放在一个SPAN中。在浏览器上双击做标注,就能自动生成采集规则
举报 使用道具
forrest62 新手上路 发表于 2018-8-28 09:52:20 | 显示全部楼层
Fuller 发表于 2018-8-24 19:34
要采集这些内容吗?在DOM上都分别放在一个SPAN中。在浏览器上双击做标注,就能自动生成采集规则
...

收到,谢谢啦,我试试
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 微博评论采集下来后怎样把发布时间转换成统
  • Jupyter Notebook将京东商品参数数据表做行
  • 集搜客分词软件情感分析算法升级通知
  • 为什么要为层次分析法(AHP)计算特征值和特
  • 在Jupyter Notebook中将分词结果转换成数组

热门用户

GMT+8, 2022-6-30 12:14