如何同时采集网页中的文字、图片、表格等多元素

gooseeker_info

比如，一个网页中含有文字、表格、图片，怎样能把这个网页上的所有元素内容同时抓取下来？？

Fuller · 发表于 2017-2-20 18:30:25

首先，集搜客网络爬虫能够同时下载图片和文字，而且下载图片的设置很简单，只需勾上“下载图片”参数即可。具体参看《采集图片网址并下载图片——已途牛网为例》

其次，表格信息是很容易采集的，因为表格本身很规整，容易做规则。像excel那样的二维表格其实在网页上没有特殊的，给每一列做内容映射以后，选取第一和第二行做样例复制，就能采集整个表格，具体参看《采集列表数据》

如何同时采集网页中的文字、图片、表格等多元素

共 1 个关于本帖的回复最后回复于 2017-2-20 18:30

推荐板块

精彩推荐

热门话题

热门用户

	B Color Image Link Quote Code Smilies 高级模式您需要登录后才可以回帖登录 \| 立即注册回帖并转播回帖后跳转到最后一页

如何同时采集网页中的文字、图片、表格等多元素

共 1 个关于本帖的回复 最后回复于 2017-2-20 18:30

推荐板块

精彩推荐

热门话题

热门用户

共 1 个关于本帖的回复最后回复于 2017-2-20 18:30