遇到一种情况,我要抓取的网页格式是一样的,但是有些网址的很多内容为空值,结果是有些有结果有些没结果,这里面是怎么判断的。
举报 使用道具
| 回复

共 3 个关于本帖的回复 最后回复于 2016-1-6 16:30

沙发
xandy 论坛元老 发表于 2016-1-6 16:25:57 | 只看该作者
对可能为空值的内容,规则里不要勾关键内容,就会自动跳过。
举报 使用道具
板凳
驻在冰箱的企鹅菌 中级会员 发表于 2016-1-6 16:28:07 | 只看该作者
xandy 发表于 2016-1-6 16:25
对可能为空值的内容,规则里不要勾关键内容,就会自动跳过。

刚才那种情况,网页里面有些内容是有的,测试的结果是标题有但是内容什么都没有。
举报 使用道具
地板
xandy 论坛元老 发表于 2016-1-6 16:30:43 | 只看该作者
驻在冰箱的企鹅菌 发表于 2016-1-6 16:28
刚才那种情况,网页里面有些内容是有的,测试的结果是标题有但是内容什么都没有。
...

你这种要修改一下整理箱的首选项,再做映射,才能出来信息呢,参考http://www.gooseeker.com/doc/for ... 9%E5%AE%9A%E4%BD%8D
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-20 15:14