我准备采集一个表格,平时都是直接扒数据,但是碰到没有数据的列时就出问题
请问有什么办法可以采集表头,如果有数据的话,就把数据采集进来
举报 使用道具
| 回复

共 7 个关于本帖的回复 最后回复于 2015-12-31 11:05

沙发
ym 版主 发表于 2015-12-31 10:54:05 | 只看该作者
截图看看
举报 使用道具
板凳
幻茗_Ask 新手上路 发表于 2015-12-31 10:55:59 | 只看该作者
网址是这个http://www.china-see.com/stockInfo.do?pageNo=1&hang=E

有些公司压根就只有名字,后面全空,需要怎么写规则呢

举报 使用道具
地板
ym 版主 发表于 2015-12-31 10:57:26 | 只看该作者
操作方法是通用的,做内容映射再做样例复制,对于可能为空的数据就不要勾关键内容,你这个表只有股份代码是必然有的,只对它勾关键内容,其他都不勾就行了
举报 使用道具
5#
幻茗_Ask 新手上路 发表于 2015-12-31 10:58:40 | 只看该作者
空的怎么做内容映射?没有text
举报 使用道具
6#
ym 版主 发表于 2015-12-31 10:59:59 | 只看该作者
高级设置里勾上文本内容,就能把整块DOM做内容映射,参考教程http://www.gooseeker.com/doc/article-101-1.html
举报 使用道具
7#
幻茗_Ask 新手上路 发表于 2015-12-31 11:02:29 | 只看该作者
还有个问题,整理箱的网页定位一般怎么选择好呢?


举报 使用道具
8#
ym 版主 发表于 2015-12-31 11:05:18 | 只看该作者
一般不用动它,抓到相同信息就修改为绝对定位,再重新做映射才能抓不同信息,具体参考http://www.gooseeker.com/doc/for ... =%E5%AE%9A%E4%BD%8D
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-26 23:50