Cloudera发布实时查询开源项目Impala(黑斑羚)!多款产品实测表明,比原来基于MapReduce的HiveSQL查询速度提升3~90倍。Impala是GoogleDremel的模仿,但在SQL功能上青出于蓝胜于蓝。
Impala采用与Hive相同的元数据、SQL语法、ODBC驱动程序和用户接口(HueBeeswax),这样在使用CDH产品时,批处理和实时查询的平台是统一的。目前支持的文件格式是文本文件和SequenceFiles(可以压缩为Snappy、GZIP和BZIP,前者性能最好)。其他格式如Avro,RCFile,LZO文本和DougCutting的Trevni将在正式版中支持。
评论