guacaphant Hadoop 和 ArangoDB 的集成开源项目

我要开发同款
匿名用户2018年01月02日
41阅读
开发技术Java
所属分类数据库相关
授权协议MIT

作品详情

通过级联将Hadoop和ArangoDB集成在一起。利用AQL来查找您想要进入Hadoop的文档以进一步分析。目前的版本只支持ArangoDB。

从文件到元组

与元组级联交易。如果列名是事先知道的,TupleEntry就是元组的一个很好的包装。

ArangoDB处理文档。真正简单的文件几乎映射到Tuple/TupleEntry范例。嵌套的文件被转换成TupleEntry。所以说你有一个人名文件“姓名”,“年龄”和“地址”。“地址”是具有“街道”,“城市” 和“州”字段的对象。Guacaphant将创建一个带有字段 “地址”,“年龄”和“名称” 的根TupleEntry。你可以将“年龄”和“名字”作为字符串访问。

方案领域

Guacaphant有两个方案构造函数:有Fields和没有Fields。如果指定了字段,那么该方案将只加载匹配的列。如果文档中不存在字段列表中的属性,则会发生cascading.tuple.FieldResolverException。最好的做法是让您的字段匹配您的退货条款。例如:

final String returnClause = "RETURN {\"name\": u.name, \"age\" : u.age, \"other\" : u.other}"final Fields inputFields = new Fields("name", "age", "other");

这将只返回指定的三个属性。如果你想包含_id或其他文档相关的元数据,只需手动将它包含在你的return子句和Fields定义中。

最好的做法是使用特定的列方法。

声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态

评论