DATAscraper新浪微博抓取数据后不生成XML文件

Sat, 01/24/2015 - 15:03 — 我是一朵小花花

我的主题是“青岛啤酒节1”，已经定义好了信息结构，在Datascraper抓取数据也一切顺利，但所有数据抓取完毕后，到最后一页，显示总线索数1 PLINE，剩余线索0 FIN，不生成数据文件夹，这个要怎么解决？

MetaSeeker工具包

Sat, 01/24/2015 - 16:09 — 我是一朵小花花

偶然发现已经下载成

偶然发现已经下载成功。
还是有另一个问题要请教一下FUller，我抓取微博数据时，因为微博分为转发与原创，针对原创微博所做的信息结构规则，在抓取到转发微博时，评论数与转发数就不可预测，可能抓取的就是转发微博的评论数与转发数，因为在DOM树上他们的名字很相像；针对转发微博所做信息结构规则，就干脆会把原创微博的信息全部忽略，我应该怎么解决这个问题呢？

Sat, 01/24/2015 - 19:40 — Fuller

要写自定义XPath表达式

自定义XPath使用起来有点复杂，首先要知道XPath是什么，这是DataScraper定位网页内容的方法，通常由MetaStudio自动生成，根据需要可以自定义，像无法分辨是本转发微波的评论数还是自己微博的评论数这种情况就需要自定义XPath，可以对自动生成的XPath就行微调，参看如何使用XPath采集网站内容

Sat, 01/24/2015 - 15:05 — 我是一朵小花花