DataSphere Studio 一站式数据应用开发管理门户开源项目

我要开发同款
匿名用户2019年12月02日
59阅读
开发技术JavaScala
所属分类大数据
授权协议Apache

作品详情

DataSphereStudio(简称DSS)是微众银行大数据平台——WeDataSphere,自研的一站式数据应用开发管理门户。

基于Linkis计算中间件构建,可轻松整合上层各数据应用系统,让数据应用开发变得简洁又易用。

DataSphereStudio定位为数据应用开发门户,闭环涵盖数据应用开发全流程。在统一的UI下,以工作流式的图形化拖拽开发体验,满足从数据导入、脱敏清洗、分析挖掘、质量检测、可视化展现、定时调度到数据输出应用等,数据应用开发全流程场景需求。

借助于Linkis计算中间件的连接、复用与简化能力,DSS天生便具备了金融级高并发、高可用、多租户隔离和资源管控等执行与调度能力。

DSS主要特点:

一、一站式、全流程的应用开发管理界面    DSS集成度极高,目前已集成的系统有:

    1、数据开发IDE工具——Scriptis

    2、数据可视化工具——Visualis(基于宜信Davinci二次开发)

    3、数据质量管理工具——Qualitis

    4、工作流调度工具——Azkaban

二、基于Linkis计算中间件,打造独有的AppJoint设计理念    AppJoint——应用关节,定义了一套统一的前后台接入规范,可让外部数据应用系统快速简单地接入,成为DSS数据应用开发中的一环。

    DSS通过串联多个AppJoint,编排成一条支持实时执行和定时调度的工作流,用户只需简单拖拽即可完成数据应用的全流程开发。

    由于AppJoint对接了Linkis,外部数据应用系统因此具备了资源管控、并发限流、用户资源管理等能力,且允许上下文信息跨系统级共享,彻底告别应用孤岛。

三、Project级管理单元    以Project为管理单元,组织和管理各数据应用系统的业务应用,定义了一套跨数据应用系统的项目协同开发通用标准。

四、已集成的数据应用组件    1、DSS的调度能力——AzkabanAppJoint

      用户的很多数据应用,通常希望具备周期性的调度能力。

      目前市面上已有的开源调度系统,与上层的其他数据应用系统整合度低,且难以融通。

      DSS通过实现AzkabanAppJoint,允许用户将一个编排好的工作流,一键发布到Azkaban中进行定时调度。

      DSS还为调度系统定义了一套标准且通用的DSS工作流解析发布规范,让其他调度系统可以轻松与DSS实现低成本对接。

    2、数据开发——ScriptisAppJoint

      什么是Scriptis?

      Scriptis是一款支持在线写SQL、Pyspark、HiveQL等脚本,提交给Linkis执行的数据分析Web工具,且支持UDF、函数、资源管控和智能诊断等企业级特性。

      ScriptisAppJoint为DSS集成了Scriptis的数据开发能力,并允许Scriptis的各种脚本类型,作为DSS工作流的节点,参与到应用开发的流程中。

      目前已支持HiveSQL、SparkSQL、Pyspark、Scala等脚本节点类型。

    3、数据可视化——VisualisAppJoint

      什么是Visualis?

      Visualis是一个基于宜信开源项目Davinci二次开发的数据可视化BI工具,为用户在数据安全和权限方面,提供金融级数据可视化能力。

      VisualisAppJoint为DSS集成了Visualis的数据可视化能力,并允许数据大屏和仪表盘,作为DSS工作流的节点,与上游的数据集市关联起来。

    4、数据质量——QualitisAppJoint

      QualitisAppJoint为DSS集成数据质量校验能力,将数据质量系统集成到DSS工作流开发中,对数据完整性、正确性等进行校验。

    5、数据发送——SenderAppJoint

      SenderAppJoint为DSS集成数据发送能力,目前支持SendEmail节点类型,所有其他节点的结果集,都可以通过邮件发送。

      例如:SendEmail节点可直接将Display数据大屏作为邮件发送出来。

    6、信号节点——SignalAppJoint

      EventCheckerAppJoint用于强化业务与流程之间的解耦和相互关联。

      DataChecker节点:检查库表分区是否存在。

      EventSender:跨工作流和工程的消息发送节点。

      EventReceiver:跨工作流和工程的消息接收节点。

    7、功能节点

      空节点、子工作流节点。

与类似系统对比    DSS是一个引领数据应用开发管理方向的开源项目,开源社区目前尚没有同类产品。

使用场景    DataSphereStudio适用于以下场景:

    1.正在筹建或初步具备大数据平台能力,但无任何数据应用工具的场景。

    2.已具备大数据基础平台能力,且仅有少数数据应用工具的场景。

    3.已具备大数据基础平台能力,且拥有全部数据应用工具,但工具间尚未打通,用户使用隔离感强、学习成本高的场景。

    4.已具备大数据基础平台能力,且拥有全部数据应用工具,部分工具已实现对接,但尚未定义统一规范的场景。

声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态

评论