BlazingSQL GPU 加速 SQL 引擎_开源项目-程序员客栈

开源地址
https://gitee.com/mirrors/BlazingSQL授权协议
Apache

BlazigSQL是RAPIDS生态系统的GPU加速SQL引擎。

RAPIDS包含一组软件库（BlazigSQL、cuDF、cuML、cuGraph），用来在GPU上执行端到端的数据科学计算和分析管道。

BlazigSQL是一个基于RAPIDS生态系统构建的GPU加速SQL引擎。RAPIDS基于ApacheArrow柱状内存格式，cuDF是一个GPUDataFrame库，用于加载、连接、聚合、过滤和操作数据。

BlazigSQL是cuDF的SQL接口，具有支持大规模数据科学工作流和企业数据集的各种功能。

主要特性：

查询外部存储数据-单行代码可以注册远程存储解决方案，例如AmazoS3。简单的SQL -非常容易使用，运行SQL查询，结果是GPUDataFrames（GDF）。互操作性-任何RAPIDS库都可以立即访问GDF以获取数据科学工作负载。

示例代码：

CVS读取：

fromblazigsqlimportBlazigCotextbc=BlazigCotext()#CreateTablefromCSVbc.create_table('taxi','/blazigdb/data/taxi.csv',delimiter=',',ames=colum_ames)#Queryresult=bc.sql('SELECTcout(*)FROMmai.taxiGROUPBYyear(key)').get()result_gdf=result.colums#PritGDFprit(result_gdf)

JSON处理：

fromblazigsqlimportBlazigCotextimportcudfbc=BlazigCotext()#LoadJSONitoGPUDataFrame(GDF)taxi_gdf=cudf.io.jso.read_jso('taxi.jso')#CreateTablefromGDFbc.create_table('taxi',taxi_gdf)#Queryresult=bc.sql('SELECTcout(*)FROMmai.taxiGROUPBYyear(key)').get()result_gdf=result.colums#PritGDFprit(result_gdf)

BlazingSQL 是 RAPIDS 生态系统的 GPU 加速 SQL 引擎。 RAPIDS 包含一组软件库（BlazingSQL、cuDF、cuML、cuGraph），用来在 GPU 上执行...

声明：本文仅代表作者观点，不代表本站立场。如果侵犯到您的合法权益，请联系我们删除侵权资源！如果遇到资源链接失效，请您通过评论或工单的方式通知管理员。未经允许，不得转载，本站所有资源文章禁止商业使用运营!

下载安装【程序员客栈】APP

实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态

前往安装

BlazingSQL GPU 加速 SQL 引擎开源项目

技术信息

作品详情

功能介绍

重点城市程序员兼职推荐

重点岗位程序员兼职推荐