您好!
本人初次使用gooseeker工具包,在设置规则到抓取数据结果,遇到不是本人预期的结果.
场景:获取电影网上局部的分类电影片信息
目标地址:http://www.dy.com.cn/
数据:分别获取热映影片,热门剧集,经典影片栏目下的影片信息.
按照目前的场景尝试,仅获取到一个影片的内容,具体的配置,由于不可以上传图片,所以未能给出.
对于数据提取和线索规则配置从文档上来看,比较难理解.希望可以针对本人的这个场景,来配置数据提取和线索规则,以便根据你们所指引的配置来理解好这两个配置规则.
另:我使用的客户端环境是:
操作系统:window xp sp2
FireFox:Mozilla/5.0 (Windows; U; Windows NT 5.1; zh-CN; rv:1.9.2.3) Gecko/20100401 Firefox/3.6.3
DataScraper:V4.10.0.0016
MetaStudio:V4.10.0.0007
谢谢.
一个讲解制作Web信息提取规则的教程
由于本网站上的用户手册几乎全部是文字,图片太少,更没有视频,所以很多用户反映难于掌握MetaStudio的使用方法。有一个用户花费了几个星期制作了一个很直观的教程,并贡献给GooSeeker社区,请下载使用
虽然为客户定制Web信息提取规则是收费项目,但是我们的技术支持人员乐意抽时间帮助初学用户免费定义少量提取规则,并尽量及时反馈给用户。如果您定义的信息结构没有达到预期目标,我们可以帮助您找出问题。由于MetaSeeker系统是一个在线的协作式Web信息提取服务,您可以告知我们您的主题名,我们的技术人员会在您定义的基础上进行修正并指出其中的错误。请放心,我们没有您的主题的改写权限,我们会另存一份并起另外一个主题名。