DATAscraper新浪微博抓取数据后不生成XML文件

我的主题是“青岛啤酒节1”,已经定义好了信息结构,在Datascraper抓取数据也一切顺利,但所有数据抓取完毕后,到最后一页,显示总线索数1 PLINE,剩余线索0 FIN,不生成数据文件夹,这个要怎么解决?

偶然发现已经下载成

偶然发现已经下载成功。
还是有另一个问题要请教一下FUller,我抓取微博数据时,因为微博分为转发与原创,针对原创微博所做的信息结构规则,在抓取到转发微博时,评论数与转发数就不可预测,可能抓取的就是转发微博的评论数与转发数,因为在DOM树上他们的名字很相像;针对转发微博所做信息结构规则,就干脆会把原创微博的信息全部忽略,我应该怎么解决这个问题呢?

要写自定义XPath表达式

自定义XPath使用起来有点复杂,首先要知道XPath是什么,这是DataScraper定位网页内容的方法,通常由MetaStudio自动生成,根据需要可以自定义,像无法分辨是本转发微波的评论数还是自己微博的评论数这种情况就需要自定义XPath,可以对自动生成的XPath就行微调,参看如何使用XPath采集网站内容

也找不到周期性抓取

也找不到周期性抓取指令文件crontab.xml 文件

周期性抓取指令文件

请看这个网址周期性抓取指令文件

Fuller,我还想请教一下

Fuller,我还想请教一下,因为我想获取比较全面的信息,但是没有一条微博是可以涵盖到所有信息的。
那么,如果我想定义样本中没有的信息结构可怎么实现?通过Xpath吗?