本帖最后由 xandy 于 2016-11-11 14:49 编辑
原理很简单:
第一步:建立一个整理箱,这里就是存储你要抓的内容
第二步:告诉程序,网页上的什么内容要丢到整理箱中。
剩下的就由程序自动做了。
两个新词别怕:
1,整理箱:前面在第一步中已经说了,放东西的,放抓取内容
2,映射:就是第二步要做的事,用“映射”告诉程序:网页上哪些内容是要采的
有些网页本身比较复杂,有些网页结构很乱,就得去一点点掌握些技巧。纯小白入门,可以从一个最简单的教程开始。
所以刚接触集搜客的同学不要觉得集搜客比较难有所畏惧,教程为大家都科学的规划好了,一步一步的学习,数据抓取其实没有大家想象的那么难。
开始阅读《[url=http://www.gooseeker.com/doc/article-325-1.html]从入门到精通》
|
共 11 个关于本帖的回复 最后回复于 2019-11-1 16:16