11#
y369654863 新手上路 发表于 2018-7-2 12:36:53 | 只看该作者

还是这个东西

1341723600.jpg (180.48 KB, 下载次数: 900)

这个编码

这个编码
举报 使用道具
12#
y369654863 新手上路 发表于 2018-7-2 12:55:21 | 只看该作者
maohui 发表于 2018-7-2 12:30
看看这篇帖子https://www.gooseeker.com/doc/thread-10128-1-1.html

我按你给的帖子操作的,但我为什么没有在下面那个框里面显示的出现加载抓取规则遇到的错误。无法定位什么的,我连这个都没有,只有完成规则的适用性检查。

QQ图片20180702125440.png (45.22 KB, 下载次数: 887)

QQ图片20180702125440.png
举报 使用道具
13#
y369654863 新手上路 发表于 2018-7-2 16:39:09 | 只看该作者
并不知道怎么办
举报 使用道具
14#
bowieD 金牌会员 发表于 2018-7-2 18:09:37 | 只看该作者

规则已经改好了吗?这边测试运行你的规则没有任何问题。
举报 使用道具
15#
Fuller 管理员 发表于 2018-7-2 18:36:21 | 只看该作者
可以给每项抓取内容都做上定位标志映射,提高规则适应性。加上定位标志后,跑了一下规则,没有问题。
举报 使用道具
16#
y369654863 新手上路 发表于 2018-7-2 21:00:12 | 只看该作者
Fuller 发表于 2018-7-2 18:36
可以给每项抓取内容都做上定位标志映射,提高规则适应性。加上定位标志后,跑了一下规则,没有问题。
...

刚按你说的试了下,再第三十页的时候又断了

833599213.jpg (185.81 KB, 下载次数: 889)

833599213.jpg
举报 使用道具
17#
y369654863 新手上路 发表于 2018-7-2 21:02:53 | 只看该作者
Fuller 发表于 2018-7-2 18:36
可以给每项抓取内容都做上定位标志映射,提高规则适应性。加上定位标志后,跑了一下规则,没有问题。
...

是按照你说的

1850607105.jpg (401.79 KB, 下载次数: 968)

1850607105.jpg
举报 使用道具
18#
y369654863 新手上路 发表于 2018-7-2 21:04:11 | 只看该作者
bowieD 发表于 2018-7-2 18:09
规则已经改好了吗?这边测试运行你的规则没有任何问题。

有问题,它只能走一半的样子就断了

举报 使用道具
19#
bowieD 金牌会员 发表于 2018-7-3 09:47:27 | 只看该作者
本帖最后由 bowieD 于 2018-7-4 09:56 编辑
y369654863 发表于 2018-7-2 21:04
有问题,它只能走一半的样子就断了

你的规则是没有问题的,只是你是以“入住时间”为关键内容,网页上到某一页之后就没有“入住时间”这个字段了,采集不到关键内容就会报错,不要以“入住时间”为关键内容,以“评价内容”作为关键内容应该就可以了。


1.png (33.84 KB, 下载次数: 947)

1.png
举报 使用道具
20#
y369654863 新手上路 发表于 2018-7-3 15:44:29 | 只看该作者
bowieD 发表于 2018-7-3 09:47
你的规则是没有问题的,只是你是以“入住时间”为关键内容,网页上到某一页之后就没有关键内容了,采集不 ...

我试一下,我之前都是一般选的四项还有容器都√了关键内容
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-29 00:13