|
版本:V8.8.0 集搜客网络爬虫
重大改动:
1,检查会员中心和爬虫的账号是否一致
2,结果文件中增加customInfo字段,允许用户添加线索的时候放一段特有的内容
3,延迟抓取的含义修改了:每个网页都强制延迟设定的时间
4,防止抓到空页面
5,采集文本时过滤script和style
6,采集到的网页片段放在CDATA中
7,解决BUG,如果用户定义的抓取内容名字与html标签名重合,生成下级线索就会出错
8,结果文件中增加字段dsName和dsThread
9,下载描述文件中增加字段dsName和dsThread
10,抓取内容增加一个高级设置“补全网址”
11,抓取自定义字体
其他改动:
1,无
版本查看:安装运行DS打数机或者MS谋数台后,选择菜单 帮助->关于,可以看到版本信息是V8.8.0
需要上述两个功能的用户请重新下载升级
|
|