大数据分析平台整体以分布式存储为设计和分析的思想进行架构设计,为公司的业务系统提供大数据解决方案,提高业务系统的实时查询性能和网络吞吐量。主要以CDH6.1.0为hadoop大数据平台的技术底座,对hadoop组件体系的集群化管理,统一控制台运维管理hadoop组件的稳定性、伸缩性、容错性、高可用性等等,可以良好的兼容Spark Streaming2.4.0、flink1.6.0、storm1.2.0等流式计算框架,集成了hive sql、spark sql、java jar、spark、shell、python离线计算资源,集成了impala3.1.0查询引擎,以及与kudu1.8.0 等存储引擎的良好集成,引入了dolphinScheduler1.0.0工作流分布式调度系统,支持spark, hive, mr, python, sub_process, shell等等任务调度。上层应用以springCloud Edgware.RELEASE微服务架构为基础、结合mysql5.7 、redisGraph1.0.8图数据库、es6.4.0、rocketmq4.2.0 等中间件和数据库搭建应用服务平台,再以vue.js2.6.0 实现前端用户UI界面的高效渲染,完整的实现前后端分离的架构设计方案。主要包括规划、研发、资产、市场、系统管理五大模块。我主要负责整个系统的需求分析、架构设计、工作安排、开发运行环境的搭建以及后期应用的部署上线。声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态
评论