Fluid-Cloudnative 云原生大数据应用支撑平台开源项目

我要开发同款
匿名用户2020年10月17日
76阅读
所属分类Google Go、数据存储、大数据、云原生
授权协议Apache 2.0

作品详情

为了解决大数据、AI等数据密集型应用在云原生计算存储分离场景下,存在的数据访问延时高、联合分析难、多维管理杂等痛点问题,南京大学PASALab、阿里巴巴、Alluxio在2020年 9月份联合发起了开源项目Fluid。

Fluid是一款开源的云原生基础架构项目。在计算和存储分离的大背景驱动下,Fluid的目标是为AI与大数据云原生应用提供一层高效便捷的数据抽象,将数据从存储抽象出来,以便达到:

通过数据亲和性调度和分布式缓存引擎加速,实现数据和计算之间的融合,从而加速计算对数据的访问;

将数据独立于存储进行管理,并且通过Kubernetes的命名空间进行资源隔离,实现数据的安全隔离;

将来自不同存储的数据联合起来进行运算,从而有机会打破不同存储的差异性带来的数据孤岛效应。

通过Kubernetes服务提供的数据层抽象,可以让数据像流体一样在诸如HDFS、OSS、Ceph等存储源和Kubernetes上层云原生应用计算之间灵活高效地移动、复制、驱逐、转换和管理。而具体数据操作对用户透明,用户不必再担心访问远端数据的效率、管理数据源的便捷性,以及如何帮助Kuberntes做出运维调度决策等问题。用户只需以最自然的Kubernetes原生数据卷方式直接访问抽象出来的数据,剩余任务和底层细节全部交给Fluid处理。

Fluid项目当前主要关注数据集编排和应用编排这两个重要场景。数据集编排可以将指定数据集的数据缓存到指定特性的Kubernetes节点;而应用编排将指定该应用调度到可以或已经存储了指定数据集的节点上。这两者还可以组合形成协同编排场景,即协同考虑数据集和应用需求进行节点资源调度。

声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态

评论