将数据映射至某一信息属性,由于有多行此类要抓取的数据,但每行代码不完全相同,所以用【样例复制品】不能做到抓去所有数据。
所以将信息属性设置了block----xpath过滤器----html片段如下。(内容提取表达式)
/html/body/div[position()=2]/table/tbody/tr/td/div/ul/li[position()=1]/b/text()
但是我要很多行这样的数据,里面的position()=1要等于2,3,4,5.。。。。。。。 请问这个在哪里可以编辑修改?(我已经尝试用内容提取表达式提取后,用样例复制,可出来的却是同一行的数据,即内容提取表达式对于每一个 for each 语句,并未改变,我想知道怎么更改,谢谢)
自定义抓取规则
这个问题,最好将目标网页列出来讨论一下。
使用在线版的,只有想办法用自动生成的抓取规则解决问题,因为不像企业版用户,可以完全控制抓取规则管理系统,可以自己开发一些管理程序,自己直接在数据库中修改抓取规则。
列出网页
http://www.amazon.cn/%E8%95%99%E5%85%B0%E7%91%9C%E4%BC%BD-%E7%AE%80%E6%9...
想抓取其中【基本信息】部分,并把 属性名 跟 属性值 分开
用样例复制品抓取亚马逊上的商品基本信息
亚马逊上的商品基本信息好抓,用个样例复制品映射,而且属性名和属性值分开存放,因为网页上属性名用黑体,属性值用普通自动,显然放在两个不同的HTML节点中,所以,很容易分开抓取。