|
在快捷采集里面的规则,通常都不做特殊的筛选。尤其像筛选星级,即使自己做规则,用规则筛选,也不要这样做。比如,翻页采集的时候,假设到第三页,符合星级要求的一条数据都没有,而第四页或者后面的页上都符合要求的。但是,到了第三页,因为符合要求的数据,翻页就中断了。
所以,正确的做法是:把各种星级的内容都采集下来,然后过滤掉不要的。
这个采集一般要分两级:
第一级:把所有星级的酒店网址都采集下来,包括星级这个值。然后把结果导出到excel中,通过排序,把符合星级的网址拷贝出来,添加到第二级
第二级:负责采集评论 |
|
共 4 个关于本帖的回复 最后回复于 2020-4-29 15:55