本帖最后由 ym 于 2015-12-17 22:00 编辑
常见问题 > 制作规则—常见问题导航 > 自定义xpath >爬取串数字,自定义XPath该怎么写
问:爬取ends后面的那串数字,自定义XPath该怎么写,论坛上的自定义XPath都是基于自动生成的数据规则作修改的,而且这个在字段在页面上看不到,但是在网页源代码里是有的
答:用“搜索”这个新功能,先找到这个节点,写个xpath填到输入框中。
比如,//button[contains(@detail:params, '144483')] 这个能不能有效我不太确定,因为这里涉及到 detail: 这样的表达,这是一个命名空间
答:在xpath输入框中输入 //button ,点击搜索,可以搜到3个button,第三个button含有这个属性
抓取网页片段,把这个button采集下来是可以的,想具体采集detail:params这个属性不行,因为detail是一种特殊的名字空间,GooSeeker不支持。
问: 可以整个弄下来了
|
共 0 个关于本帖的回复 最后回复于 2015-10-8 19:07