过滤提取的文本

如题,我想提取淘宝网商品信息,包括产品名称,价格等;但是商品名称包含了一大推无关的内容,比如“联想S500手机正品行货 双卡双待新款时尚滑盖可爱女式士后台挂QQ”,我只要里面的“联想S500”,请问如何制定提取规则,把其他内容过滤掉?谢谢!我的邮箱是bing.zhu90@gmail.com

如果被过滤的内容在另一个HTML块

如果被过滤的内容在另一个HTML块,例如,另一个DIV,可以用XSLT指令进行过滤,使用MetaStudio定义信息属性时,选择block特性,选择XSLT过滤器,可以输入一块XSLT指令片断。在本网站搜索“自定义 XSLT”可能搜索到其它资料。

但是,如果被过滤的内容与需要保留的内容在同一个文本段里面,如果被过滤的内容是固定的,可以用自定义XPath指令,使用substring-after之类的函数。

但是,如果被过滤的内容是变化的,只有自己写程序过滤了。