DS打数机是以网址为单位抓取数据的,而抓取结果是以网页为单位存储的,也就是说输入线索数为1的话,就只抓一个网址的数据,如果是没有翻页的话,就得到一个结果文件,如果有翻页操作,那么在抓这个网址的时候就会翻页,每抓一页就得到一个结果文件。查看数据结果的操作如下: 1.点击DS打数机的“文件”菜单->“存储路径”,弹出“自定义存储路径”会话框,在这里可以看到数据文件的存储路径,如图1。PS:也可以选择自己喜欢的文件夹作为存储路径。
2.根据这个存储路径,打开本地文件夹DataScraperWorks,一个主题名对应一个文件夹,打开就可以看到成功抓取的xml结果文件,每一个网页生成一个结果文件,如图2。 3.数据文件是XML类型的,可以用记事本、浏览器打开,也可以用Excel打开,excel格式如图3,可参考教程《xml转换excel格式》。 |