本帖最后由 andyhwa 于 2016-6-20 09:00 编辑
如题,在抓取58同城过户页面上,第一级规则是抓取城市列表,第二级规则是每个城市的过户信息发布列表,第三级规则才是真正需要的,包括名字、电话等,总计抓取有38万条数据,但是去重之后才1万6千条左右,也就是说417个城市平均每个城市40条!这个无论如何都是有疑问的,而且公司开发人员也排查过,发现这个规则确实会出现抓取了前几个,后几个就跳着跳着抓取,会有很大遗漏,希望尽快解决一下这个问题,谢谢,QQ:475015865,tel:18782928371这就是这三条规则
guohu_145054
guohu_245054
guohu_345054
|
|
|
|
|
共 3 个关于本帖的回复 最后回复于 2016-6-20 14:16