通过级联将Hadoop和ArangoDB集成在一起。利用AQL来查找您想要进入Hadoop的文档以进一步分析。目前的版本只支持ArangoDB。
从文件到元组
与元组级联交易。如果列名是事先知道的,TupleEntry就是元组的一个很好的包装。
ArangoDB处理文档。真正简单的文件几乎映射到Tuple/TupleEntry范例。嵌套的文件被转换成TupleEntry。所以说你有一个人名文件“姓名”,“年龄”和“地址”。“地址”是具有“街道”,“城市” 和“州”字段的对象。Guacaphant将创建一个带有字段 “地址”,“年龄”和“名称” 的根TupleEntry。你可以将“年龄”和“名字”作为字符串访问。
方案领域
Guacaphant有两个方案构造函数:有Fields和没有Fields。如果指定了字段,那么该方案将只加载匹配的列。如果文档中不存在字段列表中的属性,则会发生cascading.tuple.FieldResolverException。最好的做法是让您的字段匹配您的退货条款。例如:
final String returnClause = "RETURN {\"name\": u.name, \"age\" : u.age, \"other\" : u.other}"final Fields inputFields = new Fields("name", "age", "other");这将只返回指定的三个属性。如果你想包含_id或其他文档相关的元数据,只需手动将它包含在你的return子句和Fields定义中。
最好的做法是使用特定的列方法。
评论