GooSeeker集搜客网络爬虫,简单高效的网页采集器

加入我们

大数据管理工程师 2人

职位描述

  • 本公司运营一个庞大的网站信息采集网络和搜索引擎,其后台是一个大型数据库,关系数据库采用MySQL,信息索引和搜索采用Lucene,根据客户的不同业务要求,数据分库和分区管理,然后从这些数据库中将客户需要的数据查询出来,并且根据客户的业务目标进行统计分析,本职位的主要职责是规划客户数据存储、检索数据库并对为客户制作分析报告。

岗位职责

  1. 与网络和系统管理人员协商,为客户规划和建立数据库
  2. 管理和监视GooSeeker采集工具和入库软件的运行,确保客户需要的数据的正确采集和入库
  3. 编写数据入库规则、数据清洗规则、数据集成规则程序
  4. 应客户要求检索数据库,存成指定格式,对数据进行分析

任职资格

  1. 本科以上学历,计算机或电子相关专业
  2. 熟悉MySQL关系数据库,熟练使用SQL语言,掌握数据库管理知识
  3. 熟练使用Excel,能够用Excel进行统计分析
  4. 拥有良好的工作习惯,自主学习能力强,勤学好问
  5. 敢于探索计算机和网络相关的新领域和新技术
  6. 善于交流和表达,具有良好的团队合作精神和积极向上的职业发展态度

大数据分析工程师 2人

职位描述

  • 本公司运营一个庞大的网站信息采集网络和搜索引擎,其后台是一个大型数据库,数据库采用MySQL,数据管理工程师根据客户的不同业务要求从后台数据库中将客户需要的数据查询出来,统计给本岗位即数据分析工程师根据客户的业务目标进行统计分析,本职位的主要职责是分析采集到的数据、并针对客户需求进行数据模型的建设和梳理,为客户制作分析报告等,并为售前推广的模型相关材料提供支撑。

岗位职责

  1. 对通过我司网络爬虫等工具采集下来的原始网络数据进行初步的整理分析,提升源数据文件的可读性
  2. 使用统计工具如SPSS、excel等对整理后的源数据进行分析和建模,给出分析结论或结果
  3. 整理数据分析的成果,并制作分析报告
  4. 根据梳理的模型整理文档资料,支持售前推广等的材料编写工作

任职资格

  1. 本科以上学历,统计、数学或相关专业
  2. 至少2年以上市场调研、分析的相关工作经验
  3. 具有统计建模的基本知识,具有统计软件如SPSS的实际建模经验者优先
  4. 熟练使用office办公软件,能够用Excel进行高级数据统计&分析、并根据数据分析结果制作PPT报告
  5. 拥有良好的工作习惯,自主学习能力强,勤学好问
  6. 善于交流和表达,具有良好的团队合作精神和积极向上的职业发展态度

前端开发工程师 2人

职位描述

  • 本公司运营一个庞大的网站信息采集网络和搜索引擎,其后台是一个大型数据库,数据库采用MySQL。本职位前端开发工程师的主要职责是:根据客户和内部数据分析团队的不同业务要求,开发基于web图形化界面的数据展示平台,供客户及内部其他有需要的团队直观的评估大数据的趋势性结论,辅助客户通过大数据的分析进行业务决策。

岗位职责

  1. 按照数据分析团队提供的原始数据和需求,用前端系统开发工具开发web界面的数据展示平台,用图形化的控件在web中展现大数据的趋势等,提升源数据的价值
  2. 针对不同数据源的特点,选择和评估合适特定项目的前端编程框架,并给公司领导提供决策建议
  3. 按照不同项目的要求,配合数据分析团队的需求和后端web服务器开发部门工程师的前端对应需要,支撑项目按期高质量的交付给客户。
  4. 按上级领导对前端提出的特定需求,及时高质量完成内部工作交付。

任职资格

  1. 本科以上学历,计算机或相关专业
  2. 具有3年以上Java编程和前端开发的相关工作经验,熟悉Spring等基本服务器编程框架,掌握网页编写标准和技术,熟练阅读和编写HTML文档,了解CSS、DOM、XML等技术
  3. 具有较丰富的JS编程经验,特别是具有bootstrap、echart、hichart等JS编程框架经验者优先
  4. 能够熟练阅读计算机技术相关的英文文档
  5. 具有积极向上的职业发展态度,拥有良好的工作习惯,自主学习能力强,勤学好问
  6. 敢于探索计算机和网络相关的新领域实践新技术

Web服务器开发高级工程师 2人

职位描述

  • 本公司的网站信息采集、搜索引擎、商业情报挖掘等系统都是采用Java编写而成,部署在Tomcat应用服务器上。本职位的主要工作就是用Java开发更多服务器程序,改进现有的服务器程序。

岗位职责

  1. 根据系统架构师的系统设计方案对服务器软件进行详细设计
  2. 选择和确定合适的技术或第三方工具,实现系统架构师制定的方案
  3. 分解开发任务,制定开发计划,作为leader,管理开发过程,并承担培养初级程序员的职责
  4. 承担核心模块的编程任务
  5. 给系统架构师提出建设性意见,协助设计系统架构

任职资格

  1. 本科以上学历
  2. 具有3年以上Java编程经验
  3. 掌握Java编程各种技能,包括但不限于数据库存取、Java Bean、全文搜索、Java持久化、Java图像处理、Java HTTP通信、JSP、XML等。
  4. 掌握Spring Framework, Spring Security, Lucene,Hibernate等第三方程序框架和类库的使用方法
  5. 掌握MongoDB数据库的应用方法,具有MongoDB实际应用的经验和案例优先
  6. 积极尝试和寻找其它更合适的第三方功能组件,具有很强的新知识和技术的搜寻和学习能力
  7. 熟悉软件开发管理过程,掌握某个软件开发管理过程标准并且有实践经验者优先
  8. 熟练阅读计算机技术相关的英文文档
  9. 具有积极向上的职业发展态度,拥有良好的工作习惯,自主学习能力强,勤学好问
  10. 敢于探索计算机和网络相关的新领域实践新技术

GooSeeker爬虫服务器运行维护工程师 1人

职位描述

  • 本公司运营一个庞大的网站信息采集网络和搜索引擎,执行采集任务的爬虫软件是本公司自主研发的GooSeeker工具包,包括服务器和客户端软件,客户端软件分别称为MS谋数台和DS打数机。这些软件组成一个网络,本职位的主要职责就是确保该网络正常运行。

岗位职责

  1. 管理GooSeeker服务器,确保服务器操作系统、数据库、网络、GooSeeker服务器程序正常运行
  2. 使用MS谋数台工具为客户定义网页抓取规则
  3. 监视机房中的DS打数机采集器,确保其正常运行
  4. 应客户要求,导入导出数据

任职资格

  1. 本科以上学历,计算机或电子相关专业
  2. 熟悉互联网技术,了解网站建设方法和过程,对SEO有一定认识
  3. 掌握网页编写标准和技术,熟练阅读和编写HTML文档,了解CSS、DOM、XML、XPATH和XSLT等技术者优先
  4. 掌握Windows服务器,Linux服务器的管理方法,掌握TCP/IP,HTTP等网络管理方法
  5. 拥有良好的工作习惯,自主学习能力强,勤学好问
  6. 敢于探索计算机和网络相关的新领域和新技术
  7. 具有良好的团队合作精神和积极向上的职业发展态度
V8.4 版权所有 © 2007-2016 GooSeeker 深圳市天据电子商务有限公司
粤ICP备11065265号-2 粤公网安备 44030502000239号