当目标页面出现一个提示信息(比方说你要查找的信息不存在或是其他),其内容格式跟我定义的信息结构不相符时,发现DataScraper就停在那了,不能继续下条线索的提取,在日志文件里面发现以下提示: DataScraperEngine handleLoadEvent DEBUG: load has been caught
请问这个问题可以解决吗?该如何设置参数?
如果没有设置延长模式,当看到那条日志信息时,DataScraper就会报:Suitable Data Schema Cannot be Found错误,并将线索状态设置成unknownschema,然后就跳过这个线索
如果设置延长模式,就得等到超时,超时时间可以在周期性提取指令文件中设置。如果想尽快跳过该线索,而且假设不相符的网页的信息结构都一样,那么找一个作为样本页面,为它定义一个信息结构,其主题名与正常网页的主题名一致,而middle name不同
周期性提取指令文件哪个参数表示超时?
谢谢
该参数说明:http://www.gooseeker.com/cn/node/technology/files/pss
O(∩_∩)O~
如果设置了延长模式就要等到超时
如果没有设置延长模式,当看到那条日志信息时,DataScraper就会报:Suitable Data Schema Cannot be Found错误,并将线索状态设置成unknownschema,然后就跳过这个线索
如果设置延长模式,就得等到超时,超时时间可以在周期性提取指令文件中设置。如果想尽快跳过该线索,而且假设不相符的网页的信息结构都一样,那么找一个作为样本页面,为它定义一个信息结构,其主题名与正常网页的主题名一致,而middle name不同
不是很明白
周期性提取指令文件哪个参数表示超时?
谢谢
loadTimeout是超时参数
该参数说明:http://www.gooseeker.com/cn/node/technology/files/pss
谢谢
O(∩_∩)O~