如下如所示。


举报 使用道具
| 回复

共 11 个关于本帖的回复 最后回复于 2016-9-22 11:38

沙发
scraper 论坛元老 发表于 2016-9-21 20:23:54 | 只看该作者
你做嵌套的样例复制,应该可以
举报 使用道具
板凳
Fuller 管理员 发表于 2016-9-21 20:31:06 | 只看该作者
过滤空白的td,可以用自定义的xpath表达式。

不过我建议都抓取下来,在导入excel之后,把空白的过滤掉
举报 使用道具
地板
46780761 新手上路 发表于 2016-9-22 08:43:38 | 只看该作者
scraper 发表于 2016-9-21 20:23
你做嵌套的样例复制,应该可以

嵌套可以,但是无法过滤空白TD
举报 使用道具
5#
46780761 新手上路 发表于 2016-9-22 08:45:09 | 只看该作者
Fuller 发表于 2016-9-21 20:31
过滤空白的td,可以用自定义的xpath表达式。

不过我建议都抓取下来,在导入excel之后,把空白的过滤掉 ...

xpath会写,但是用xpath貌似无法定位容器类节点。
试了好多次都不成功
举报 使用道具
6#
46780761 新手上路 发表于 2016-9-22 08:48:52 | 只看该作者
Fuller 发表于 2016-9-21 20:31
过滤空白的td,可以用自定义的xpath表达式。

不过我建议都抓取下来,在导入excel之后,把空白的过滤掉 ...

如果是数据是直接要使用的,在excel中操作没问题。
但是数据并非直接使用,这个采集是寻找下级线索。
都出来就会导致有无效线索出现
举报 使用道具
7#
Fuller 管理员 发表于 2016-9-22 08:56:58 | 只看该作者
46780761 发表于 2016-9-22 08:48
如果是数据是直接要使用的,在excel中操作没问题。
但是数据并非直接使用,这个采集是寻找下级线索。
都 ...

规则名是什么?可以帮你看看
举报 使用道具
8#
46780761 新手上路 发表于 2016-9-22 09:08:42 | 只看该作者
Fuller 发表于 2016-9-22 08:56
规则名是什么?可以帮你看看

已经私信给你。谢谢
举报 使用道具
9#
Fuller 管理员 发表于 2016-9-22 09:36:43 | 只看该作者
46780761 发表于 2016-9-22 09:08
已经私信给你。谢谢

执行如下步骤:
1)存规则
2)点击“创建规则”工作台上的“测试”按钮,看到输出结果,选择输出窗口的“数据规则”页签
3)手工修改数据规则,如下图
4)点击“保存修改”

注意:手工修改并且保存修改以后,不能再点“存规则”,否则手工修改部分就被覆盖了



另外,你的整理箱少了一层样例复制,还要给每行做样例复制,如下图


举报 使用道具
10#
46780761 新手上路 发表于 2016-9-22 09:44:10 | 只看该作者
Fuller 发表于 2016-9-22 09:36
执行如下步骤:
1)存规则
2)点击“创建规则”工作台上的“测试”按钮,看到输出结果,选择输出窗口的“ ...

感谢。我试试看。。
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-20 02:07