最后登录 1970-1-1
最后登录 2025-3-13
Fuller 发表于 2016-6-16 22:38 1234是4个独立网址吗?如果是独立网址,那么不确保顺序的,因为每个独立网址都是一个线索,当网络爬虫部署 ...
banjolaura 发表于 2016-6-17 10:02 哦,不是的,可能我没说清楚。我爬取的是企业列表。一页内有十个企业,假如企业的排序是12345,那我爬取 ...
Fuller 发表于 2016-6-17 11:08 抓取结果是xml文件,在这个文件中,顺序是否错乱?如果规则做的正确,在xml文件中不会错乱。 如果是转换 ...
banjolaura 发表于 2016-6-17 15:50 我现在大概知道是怎么回事了,excel和xml是一致的,没有问题。是我抓取的网站是变化的,不同时间去访问同 ...
gsk117520 发表于 2016-6-17 16:44 你好像没表达清楚,其实我现在也在找方法, 你的意思是你在这个网页抓出来的数据,顺序不对 有时候甚至不 ...
Fuller 发表于 2016-6-17 17:17 集搜客是原样抓取,如果网页上的内容变化了,爬虫没有办法解决,你可以在处理数据的时候,根据内容进行排 ...
发表回复 回帖并转播 回帖后跳转到最后一页
GMT+8, 2025-3-13 12:40
共 10 个关于本帖的回复 最后回复于 2016-9-25 13:01