前边我说错了。这7天的内容都在同一个网页上,所以,做连续点击没有意义,因为已经存在于网页上了,不用再点击了,只做抓取规则就行了。
最大的麻烦是每天都不一样。要找下规律,可以看到有如下三类网页块
1)交通
2)第N站
3)两地相距
仔细看DOM,发现结构特别清晰。抓取所有天的内容不要用样例复制,而是用定位标志映射,就是把第一个红框的标志映射给容器节点。
做规则的时候,找一个最全的天,整理箱中的抓取内容只存储一天内的信息。把所有抓取内容映射完以后,还要给他们做定位标志映射,最后给容器节点也做定位标志映射,用来抓多实例
|
共 18 个关于本帖的回复 最后回复于 2016-9-8 17:29