是这个schema, hammerlet_mitbbs 我设置的是相对线索来翻页,刚开始检测还很好,但是一上载,就不能翻页,然后我再加载,然后它就会说那个线索坏了。能否解答一下~ 谢谢!!
你的这些信息结构我都加载不了,因为他们的样本页面都反问不了。我简单看了一下数据库中的数据,建议:
做完抓取规则以后,在Clue Editor工作台,点击ViewSCE看一下翻页抓取规则,如果翻页定位XPath很长,就很不可靠,我看到bovent那个,采用记号映射,生成的XPath规则很长。那么需要选择MetaStudio菜单“配置”-〉“首选项”,里面有两个tab,选择“线索定位”那个,可以尝试一下,比如,改成优选class,看看XPath规则是否会缩短。如果网页上没有可用的FreeFormat标志,试也没有用
但是仍然不行。是香港的一个论坛。是打不开吗?但是我这里可以加载,很奇怪。
要设置线索定位的首选项
你的这些信息结构我都加载不了,因为他们的样本页面都反问不了。我简单看了一下数据库中的数据,建议:
做完抓取规则以后,在Clue Editor工作台,点击ViewSCE看一下翻页抓取规则,如果翻页定位XPath很长,就很不可靠,我看到bovent那个,采用记号映射,生成的XPath规则很长。那么需要选择MetaStudio菜单“配置”-〉“首选项”,里面有两个tab,选择“线索定位”那个,可以尝试一下,比如,改成优选class,看看XPath规则是否会缩短。如果网页上没有可用的FreeFormat标志,试也没有用
我把全局定位线索定位和freeformat的定位都调成了class
但是仍然不行。是香港的一个论坛。是打不开吗?但是我这里可以加载,很奇怪。