Apache Tajo 分布式数据仓库系统开源项目

我要开发同款
匿名用户2013年11月21日
108阅读
开发技术Java
所属分类大数据、其他
授权协议Apache

作品详情

Tajo是一个分布式数据仓库系统,基于Hadoop实现,特点是低延迟、高可伸缩,提供专用查询和ETL工具

特点:

可伸缩性和低延迟

完全分布式的SQL查询处理,基于存储雨HDFS的大数据集

超低响应时间(约100毫秒),在合理数据范围内的简单查询

支持长时间运行的查询

容错支持,避免某些任务失败后的查询重启

动态调度,处理和异构集群节点故障

ETL

ETL可实现不同数据格式之间的转换

支持多种文件格式,如CSV、RCFile和RowFile

扩展性

支持用户自定义函数

提供自定义文件格式的Scanner/Appender接口

兼容性

遵循ANSI/ISOSQL标准,非标准方面遵循PostgreSQL规范

支持HiveQL模式

在HCatalog和HiveMetaStore实现表访问

支持JDBC驱动

简单

提供交互式Shell来提交SQL查询到Tajo集群

提供备份和恢复工具

异步/同步JavaAPI来提交SQL查询到Tajo集群

声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态

评论