第一个规则名:北京酒店1182家住宿
第二个规则名:北京特色住宿
第三个规则名:北京住宿531
问题:我想爬取缤客网站上的北京民宿数据(每条数据,8个字段,分别是酒店名称,区域,价格,评分等等),用集搜客订规则爬取到1万多条数据,发现数据大量重复,在Excel中清楚重复值后,数据集只剩16条数据信息。这个网页翻页div节点处没有“下一页”字样。我尝试了官网上提供的哪几种方法,都不管用。研究xpath,没弄清楚,xpath太复杂了。。请问这样的问题有什么方法解决吗?谢谢
ps:三个规则名分别是先后尝试了3遍,用不同的方法,最终都没有解决。哪位大神帮帮忙~~
|
|
|
|
|
共 5 个关于本帖的回复 最后回复于 2019-3-11 17:47